ทำไมรหัสพันธุกรรมถึงต้องมีรหัสหยุด 3 ตัว

By: terminus
Writer
on Sun, 07/10/2012 - 01:13

Genetic code ก็เป็นสิ่งที่นักชีววิทยาเรียกแบบแผนการแปลรหัส (translation) จากลำดับของเบสที่อยู่บน mRNA ไปเป็นลำดับของกรดอะมิโนบนสายโพลีเปปไทด์ (สายโปรตีน) รหัสของกรดอะมิโนจะถูกเขียนอยู่ในรูปของชุดเบสสามตัวเรียกว่า "codon" ซึ่งแทนค่ากรดอะมิโนทั้ง 20 ชนิด และรหัสหยุด (stop codon) อีกสามตัว (หากสงสัยว่าทำไมรหัส codon ต้องเป็นเบสสามตัวเรียงกัน นักวิทยาศาสตร์ก็มีสมมติฐานไว้เหมือนกันในบทความ "ไขปริศนา 'กำเนิดรหัสแห่งชีวิต'")

สิ่งมีชีวิตเกือบทุกชนิดบนโลกนี้ใช้ Genetic code เหมือนกันทั้งหมด แม้ว่าจะมีสิ่งมีชีวิตบางตัวหรือบางอย่าง แปล codon บางรหัสไม่เหมือนกับชาวบ้าน เช่น แบคทีเรียและ archea บางชนิด, ยีสต์บางชนิด, ไมโทคอนเดรียหรือพลาสติดของบางเซลล์ เป็นต้น แต่พวกนี้ก็มีจำนวนเล็กน้อยมาก เราจึงเรียก Genetic code ชุดที่สิ่งมีชีวิตส่วนใหญ่ใช้กันว่า "ชุดมาตรฐาน" (Standard Genetic code) หรือ "ชุดสากล" (Universal Genetic code)

ในขั้นตอนการแปลรหัส กระบวนการสร้างสายโปรตีนจะเริ่มตรงจุดที่เรียกว่า "รหัสเริ่ม" (start codon) และกระบวนการจะสิ้นสุดตรงรหัสหยุด หลังจากนั้นพวกไรโบโซม, mRNA, tRNA, สายโปรตีนที่แปลออกมา, และเอนไซม์ที่เกี่ยวข้องก็จะแยกย้ายกันไปทำงานอื่นหรือเข้าโรงรีไซเคิลต่อไป

รหัสเริ่มใน Standard Genetic code คือ AUG ซึ่งแทนค่ากรดอะมิโน methionine (ในกรณีของแบคทีเรีย รหัส AUG ตรงตำแหน่ง start จะถูกแปลรหัสเป็น formylmethionine) ส่วนรหัสหยุดมีด้วยกัน 3 ตัว คือ UAA, UGA, UAG

ไม่มีใครรู้ว่าทำไมรหัสหยุดใน Standard Genetic code ถึงมี 3 ตัว ในขณะที่รหัสเริ่มมีเพียงแค่ตัวเดียว? และทำไมต้องเป็นสามตัวนั้น?

หนึ่งในคำอธิบายที่สมเหตุสมผลมากที่สุดในปัจจุบัน คือ สมมติฐานที่มีชื่อว่า "Ambush hypothesis" ของ Hervé Seligmann และ David D. Pollock ซึ่งอธิบายไว้ว่า รหัสหยุดถูกคัดเลือกให้เป็น UAA, UGA, UAG เนื่องจาก ในกรณีที่เกิดการผิดพลาดทำให้รหัสบน mRNA ถูกอ่านผิดเฟรม (frame-shift) เช่น จากที่รหัสที่ถูกต้อง ...-AGU-AGA-AUU-GUA มันกลับแปลเป็น ..A-GUA-GAA-UUG-UA.-... เป็นต้น เซลล์ก็ควรจะหยุดการสร้างโปรตีนให้เร็วที่สุดเพื่อลดการขาดทุน ดังนั้นรหัสที่มีโอกาสสูงที่จะโผล่ขึ้นมาเมื่อเกิด frame-shift จึงถูกคัดเลือกไว้เป็นรหัสหยุด ซึ่งรหัสหยุดโดยบังเอิญพวกนี้ (เรียกว่า hidden stop codon หรือ off-frame stop codon) ก็ได้แก่ UAA, UGA, UAG นั่นเอง เสมือนว่านี่เป็นกลไกลดความเสียหายจากการผิดพลาดที่ซุ่มซ่อนไว้ในรหัสพันธุกรรม (DNA and Cell Biology 23(10) doi:10.1089/dna.2004.23.701)

Michal Křížek (นักคณิตศาสตร์) กับ Pavel Křížek (นักชีววิทยา) คิดว่า Ambush hypothesis น่าจะใช้ตอบคำถาม "ทำไมรหัสหยุดถึงมี 3 ตัว?" ได้ด้วย ทั้งสองเลยลองคำนวณความน่าจะเป็นที่ hidden stop codon จะโผล่ขึ้นมาจาก frame-shift ในกรณีสมมติที่มีรหัสหยุด 1 ตัว, 2 ตัว, และ 3 ตัวตามลำดับ

สูตรความน่าจะเป็นของการเกิด hidden stop codon โผล่ขึ้นมาอย่างน้อย 1 ตัว หลังจากผ่านขั้นตอนการแปลรหัสไป n ขั้น คือ

P(n) = 1 - (1-p)n

ต่อจากนั้น ทั้งสองก็เอาข้อมูลจีโนมจาก Drosophila Heterochromatin Genome Project มาเปรียบเทียบ โดยลองสุ่มเลื่อนเฟรมการอ่าน ผลปรากฏว่าโอกาสในการมี hidden stop codon ของจีโนมแมลงหวี่ Drosophila โผล่ขึ้นมานั้นสูงกว่าค่าความน่าจะเป็นตามทฤษฎีในกรณีสมมติที่มีรหัสหยุด 3 ตัวอยู่เล็กน้อย ตามรูป

เครดิต Křížek 2012

ผลที่ออกมานี้ตรงกับที่ทั้งสองคาดการณ์ไว้จาก Ambush Hypothesis นั่นคือการมีรหัสหยุดจำนวนสามตัวเป็นค่าที่เหมาะสมที่สุดในการลดความขาดทุนจากความผิดพลาด หากน้อยกว่านี้ การเกิด frame-shift แต่ละครั้งจะทำให้เซลล์ต้องขาดทุนพลังงานและทรัพยากรเป็นปริมาณมากไปกับสร้างโปรตีนที่ใช้การไม่ได้ ส่วนเรื่องที่ค่าที่ได้จากข้อมูลจีโนมแมลงหวี่สูงล้นเกินค่าทางทฤษฎีนั้นคงจะเป็นเพราะว่าข้อมูลจีโนมที่ถูกเลือกมาใช้วิเคราะห์ในครั้งนี้มีสัดส่วนของคู่เบส A-T สูงกว่าคู่เบส C-G มาก ซึ่งทำให้มันมีความเสี่ยงที่จะเกิดความผิดพลาดในการถอดรหัสและแปลรหัสสูงกว่าจีโนมทั่วไป (พันธะเชื่อม A-T หรือ A-U เป็นพันธะไฮโดรเจน 2 พันธะ ต่างจาก C-G ที่มีพันธะไฮโดรเจน 3 พันธะ ดังนั้นสายคู่เกลียว DNA ที่มี A-T เยอะๆ จึงจับกันไม่แน่นปึ้กเท่าไรเมื่อเทียบกับสายที่มี C-G เยอะ)

นอกจากนี้ Michal Křížek และ Pavel Křížek ยังให้ข้อสังเกตด้วยว่ารหัสหยุดทั้งสามใน Standard Gentic Code ไม่มีเบส C อยู่ในรหัสเลย ถ้าไม่ใช่เพราะความบังเอิญ มันก็อาจเป็นเพราะว่าเบส C มีโอกาสกลายพันธุ์ไปเป็น T หรือ U ได้สูง จึงไม่เหมาะจะถูกคัดเลือกมาเป็นรหัสหยุด

เมื่อมองว่าเบส C หนึ่งตัวไม่เหมาะสมที่จะเอามาทำเป็นรหัสหยุดแล้ว เลข 3 จึงเป็นจำนวนที่เหมาะสมที่สุด เพราะเลข 3 เป็นจำนวนที่น้อยที่สุดที่หาร 64 ไม่ลงตัว (เลข 64 มาจาก 43 ซึ่งก็คือ รูปแบบทั้งหมดในการสับเรียงเบสใน codon) มันจึงเป็นจำนวนที่พอเหมาะพอเจาะให้มีโอกาสเกิด hidden stop codon สูงพอในระดับที่เชื่อถือได้ ไม่น้อยเกินไป แต่ก็ไม่มากเกินไปจนรบกวนรหัสของกรดอะมิโนตัวอื่นๆ ของ Genetic Code

บทความงานวิจัยของ Michal Křížek และ Pavel Křížek ตีพิมพ์ใน Journal of Theoretical Biology 304:183–187 เมื่อวันที่ 7 กรกฎาคม 2012 doi: 10.1016/j.jtbi.2012.03.026

3 Comments

-Rookies-'s picture

อ่านแล้วทึ่ง ธรรมชาติคำนวณทุกอย่างไว้ขนาดนี้เชียว (ถึงจะมองไปอีกแง่ว่ามันก็เป็นแค่การคัดเลือกทางธรรมชาติธรรมดา ๆ ก็เถอะ)

tanapon000's picture

โอกาสเกิดเป็นคนได้นี่ 1ในล้านๆล้านๆ ๆ ๆ ๆ เลยนะเนี่ย กว่าที่ DNA พวกนี้ จะพัฒนามาได้

hisoft's picture

ขอบคุณครับ วันนี้ทำข้อสอบได้เพิ่มข้อนึงเพราะข่าวนี้ (- -)d

The Phantom Thief