當前位置：首頁 > 科技 > 正文

生物信息分析中的reads是什麼

啟示号
科技
3年前
910

由于受目前測序水平的限制，基因組測序時需要先将基因組打斷成DNA片段，然後再建庫測序。reads（讀長）指的是測序儀單次測序所得到的堿基序列，也就是一連串的ATCGGGTA之類的，它不是基因組中的組成。不同的測序儀器，reads長度不一樣。對整個基因組進行測序，就會産生成百上千萬的reads。

測序得到的原始圖像數據經 base calling 轉化為序列數據，我們稱之為 raw data 或 raw reads ，結果以 fastq 文件格式存儲， fastq 文件為用戶得到的最原始文件，裡面存儲 reads 的序列以及 reads 的測序質量。在 fastq 格式文件中每個 read 由四行描述：

     
 
      
  @read ID
      
  TGGCGGAGGGATTTGAACCC
      
  +
      
  bbbbbbbbabbbbbbbbbbb

Single-end(SE)測序：1個fastq文件
Pair-end(PE)測序：2個fastq文件分别存放read1和read2的數據

每個序列共有4行，第1行和第3行是序列名稱(有的 fq 文件為了節省存儲空間會省略第三行“＋”後面的序列名稱)；第2行是序列；第4行是序列的測序質量，每個字符對應第2行每個堿基，第4行每個字符對應的 ASCII 值減去64，即為該堿基的測序質量值，比如 h 對應的 ASCII 值為104，那麼其對應的堿基質量值是40。
堿基質量值範圍為0到40。下表為 Solexa 測序錯誤率與測序質量值簡明對應關系，具體計算公式如下：

Q = -10 log10P

Solexa測序錯誤率與測序質量值簡明對應關系:

高通量測序時,在芯片上的每個反應,會讀出一條序列,是比較短的,叫read,它們是原始數據；

有很多reads通過片段重疊,能夠組裝成一個更大的片段,稱為contig；

多個contigs通過片段重疊,組成一個更長的scaffold；

一個contig被組成出來之後,鑒定發現它是編碼蛋白質的基因,就叫singleton；
多個contigs組裝成scaffold之後,鑒定發現它編碼蛋白質的基因,叫unigene.

你可能想看：

基于NodeJs的Redis使用

varredis=require('redis'),字符串操作;console.log(err;function(err;response){;console.log(err,client.hget(...

淺析中國近現代地産營銷 ——展望淄博地産2020

突然有感寫幾句對地産營銷方面的感悟，由于房地産逐漸進入品牌化、高品質時代，甚至淄博某樓盤推出8萬的渠道費用，這就需要專業營銷人的思維：2020年地産營銷進入營銷立體矩陣時代，近幾年地産策劃人已經被渠道...

華為HMS Core是什麼？有什麼作用？

華為HMS包括華為賬号、華為浏覽器、華為地圖、遊戲服務、定位服務、雲空間服務等一系列華為自産服務，目的是用來為手機提供基礎服務的。HMS Core是華為終端雲服務開放能力的合集。這些能力和服務會幫助應...

Cell Reseach：caspase11切割gasderminD引發“細胞焦亡” - 基因編輯專區 - 生物谷

這些炎性caspase的激活能夠促進細胞焦亡事件的發生，炎性caspase究竟是如何調節這些細胞事件至今仍然有待解決。該蛋白的切割能夠引發細胞焦亡事件的發生。他們發現這一突變體小鼠不能夠正常發生細胞焦...

《信息技術課中的學情分析之淺見》學習心得

使我懂得了學情分析的重要性、學到了學情分析的方法、方案，學情分析即為教學設計中的學生對象分析，它包含對學生年齡特點、學生已有知識經驗、學生學習能力和學習風格、興趣等方面的分析。學情分析過程中不僅要關注...

電力系統中的“備自投裝置”是什麼？什麼原理？有什麼作用？

供配電在各個領域也不斷向自動化、無人值守、遠程控制、不間斷供電的目标邁進。保證電源的不間斷供電和供電的高可靠性成了現代配電工程中保護和控制回路的重要部分。在GB50062 《電力裝置的繼電保護和自動裝...

此八字父資産上億，丈夫無能信息明顯，八字看人生六親信息俱全

曾有學者訪師為此句八字斷語付出萬元）。年月陰陽二氣定用神為金水無疑，日主為乙酉有貴氣可能因有金平衡，但生于戊寅時把大好格局破壞了（寅生午克酉，夫宮官星丈夫為用受重克）夫無能。戊為父在父母宮，父親能幹，...

OS/PFS/DSS/DFS-各種生存指标傻傻分不清

因為患者死亡的日期确認沒有困難，判斷病人是否病情惡化的難度要大得多，發生惡化的定義通常涉及影像學資料（普通X線：沒有複發或沒有死亡可以反映臨床獲益？明确是否複發的難度要大得多。結局指标改變為由特定疾...

劉植榮：CDS走上邪路的秘密

信用違約互換（CDS）在其發展初期對金融市場起到了”一些基金公司看到了CDS的妙用，也就是企業違約風險下降，投機者就豪賭企業違約風險，美國債務市場每年的違約發生率在0.2%上下，A金融機構發現某企業違...

抑郁症吃這些食物可以自行好轉！（附抑郁症sds抑郁症自測測試題）

臨床醫生在制定有助于預防抑郁症的飲食選擇時，應該考慮最主要的抗抑郁營養素。他們認為對這類疾病最有效的 12 種抗抑郁營養素是：政府機構和食品制造商提供的立志于對抗疾病以及改善健康的信息。當然這個時候你...

【技術分享】ADSS光纜施工及注意事項

光纜在水平和垂直兩個方向上的投影不應與導線的地線出現交叉，以避免在風偏和蠕動時光纜與導線、地線産生碰撞（也稱鞭擊）。根據《安規》在帶電線路上進行ADSS光纜架設施工，ADSS光纜的架設施工中張力和側壓...

投資到底是什麼？投資到底是什麼？文/金立成筆者認為，簡單來說，投資從表面上看是金融，從深層次...

投資到底是什麼？投資從表面上看是金融；從深層次看其背後是經濟、曆史、哲學、宗教和人性；投資還是一項錢生錢的生意。投資更是一種注定隻有極少人能掌握的稀缺技能，投資者對投資的理解越深，有關投資的诠釋，投資...

授權，是什麼？不是什麼？

授權一事需要授權者與被授權者雙方密切的合作，被授權者對授權者負有報告及完成任務的責任，授權實質上是将權力分派給其他人以完成特定活動的過程，将決策的權力從組織中的一個層級移交至另一個層級，授權式的管理革...

先天八卦數是什麼? 後天八卦數是什麼？

先天八卦是中華民族人文始祖——伏羲所畫。它是乾坤定南北，上為天為乾，右為西為坎。先天八卦數是：乾一、兌二、離三、震四、巽五、坎六、艮七、坤八。後天八卦是商代時期的周文王所畫，後天八卦來自于洛書，後天八...

你認為自己沒有錢的原因是什麼？賺錢的核心究竟是什麼？

你認為自己沒有錢的原因是什麼？家裡沒有資源支持？賺錢的核心在于你有沒有能力接住财富：更别說用這一百萬當杠杆來撬動更多的财富，這個世界上太多都接不住的例子了，你才會真正地明白賺錢的核心究竟是什麼，有時候...

TCGA甲基化分析工具-MEXPRESS

今天再來給大家介紹一個研究TCGA的DNA甲基化與表達數據的工具——MEXPRESS，癌基因的DNA甲基化水平降低或者抑癌基因的DNA甲基化水平增高都可能會導緻腫瘤的發生，工具的使用隻需輸入基因名+選...

想不想在40歲前實現财務自由？來看看流行于美國年輕人中的“FIRE運動”

你有沒有想過在40歲前實現财務自由？盡早實現财務自由。旅遊、享受美食、創作藝術品、……那你不妨學學流行于美國年輕人間的“在年輕時快速積累一定财富，FIRE人群主張先進行儲蓄，然後依靠4%的年化收益率的...

商務談判信息的整理與分析

對獲得的談判信息進行評價是信息整理的第一步，信息的篩選一般通過以下方法。但這種方法需要信息收集和篩選人員具有比較紮實的市場專業知識和敏銳度。二、信息的分類與保存。對信息進行分類非常必要，在後期的信息分...

經常講：無極生太極，太極生兩儀，兩儀生四相，四相生八卦太極是什麼，兩儀、四相、八卦又是什...

太極是中國思想史上的一個重要概念，後來在宋代理學中被進一步闡釋。一般是指宇宙最原始的基因，陰陽未分的混沌狀态。形成萬物（宇宙）的本源。太極圖據傳是宋朝道士陳抟所創。太極的概念，最早莊子和易傳中使用，一...

現代戰争中的信息戰知識庫（4）

綜合運用軍事欺騙、作戰保密、、和對敵方信息系統的、阻斷敵方的信息流，同時設多部收信機以專向通信方法分别接收數個下級台信息。三部以上無線電台之間使用相同的聯絡規定建立通信的方法。裝備保障機關與裝備保障部...

大腦如何調取記憶中的信息

）我感興趣的是人是如何獲取（喚醒）記憶的。不會將各種信息分門別類地儲存在不同的文件夾裏，然後用明亮的顏色給某個文件夾添加「名字」這樣一個標籤，——比電腦文件系統高得多的這種功能，...這些圈子中逐一尋...

什麼是數字信号？什麼是模拟信号?它們區别是什麼？

摸拟信号則可以是任意數值狀态，而摸拟信号則是連續變化的物理量。在這種處理數字信号的電路中：所以還需要引入時鐘同步信号，時鐘信号由固定寬度的高低電平形成“在時鐘信号的電平由高變為低時”由此可見數據傳速和...

為什麼說火星上發現滅絕的生物體，将會是人類絕望的開始？

事實上科學家們推測火星上曾經有過生命體！人類探測地外星球技術越來越先進，探測火星是人類探測太陽系乃至整個宇宙的前哨基地。就證明科學家們對火星上曾經有過生命的推測是正确的。現在的火星是否适合人類生存，其...

互動問答 | 雞眼、瘊子、疣……身體為什麼會長這些贅生物？

兩個腳掌長雞眼，老師能不能說說雞眼是怎麼回事？老師給咱們講一下雞眼産生的原因在哪？都代表它所在的經脈出現了問題。手腳長雞眼比較常見，要是在一個地方反複長雞眼，代表肝經出了問題，小趾一側長，代表膽經出了...

貓咪眼中的世界是什麼顔色？

那麼貓咪的眼睛能分辨出色彩嗎？研究表明狗狗的眼睛也是能分辨藍色、紫色、黃色等很少幾種色調。（下面是人類和狗狗分别能看到的顔色對比圖），貓咪雖然不像人類那樣能夠看到色彩斑斓的世界。人的眼睛能夠捕捉光線的...

中醫中的少陰病症是什麼？

中醫中的少陰病症是什麼？少陰病屬六經辨證，主要用于外感熱病。其中的少陰病證見下：少陰經屬心和腎，少陰病以陽虛裡寒為主，少陰病的形成，或外邪直中，内奪腎陰。少陰腎與太陽膀胱為表裡，故在少陰病中每有停水與...

EXCEL中的行高和列寬單位是什麼？怎麼樣換算成毫米？

一、默認度量單位的設置 Word的默認度量單位用于對話框中輸入的數值和Word，中就可以選擇默認度量單位了。還要知道在哪些地方很好地應用和設置度量單位，度量單位的設置一般分默認和特指兩種方式。例如在頁...

測序序列質量數據 reads

上一篇
健康關懷的句子【100】

下一篇
治療肩周炎的10個驗方（内含福利日獲獎名單）

生物信息分析中的reads是什麼

有話要說...取消回複

最新文章

五行對應的行業（筆記收藏）

沒有不适合的人，隻有不适合的崗位

倪海廈——神農本草經筆記（一九0）紫草（紫根）

《紅磨坊》與《如果·愛》，戲中戲裡的悲豔浮華

風雷打闆：宜昌“瑞鶴仙”打闆思路解密

如何做趨勢交易

教師基本功（39）：教師相互聽課究竟應聽什麼

經絡治療咽喉炎

熱門文章

威士忌高階關于 OB 與 IB，一次給你說透！

每日一誦傷寒論第241條

老張老李侃門球之140篇

美麗中國-2870：中國最大的内陸河，塔裡木河

這個穴位可以治療多種胃痛腹痛，還可以減肥

治療坐骨神經痛藥酒５方

診餘雜記（師傳經驗）

為什麼五點鐘要起床答案讓人吃驚！（現在知道還不晚）