コドン: RNA 配列とアミノ酸を対応づけるルール

UBC/genetics/exp_codon

このページの最終更新日: 2025/11/23

概要: コドンとは
- なぜコドンは縮重しているのか？
- 同義置換と非同義置換
開始コドン
終止コドン
レアコドンとは

別ページ

コドンを解読した実験

概要: コドンとは

mRNA は、以下の規則に従ってアミノ酸に翻訳される (2)。

3 つの塩基が 1 つのアミノ酸をコードする。塩基は AUGC の 4 種類であり、可能な組み合わせは 4 x 4 x 4 = 64 通りである。しかし、タンパク質を構成するアミノ酸は 20 種類なので、複数の組み合わせが同じアミノ酸をコードすることになる。これを、コドンが縮重 degenerate しているという。とくに 3 番目の塩基が縮重していることが多い。
コードは原則として重ならない。たとえば ATTCAAGTA という配列があり、最初のコードが ATT であった場合、次の読み枠は CAA、その次は GTA である。3 塩基ずれるということ。ただし、バクテリアやミトコンドリア DNA では頻繁に重複がある。
句読点のような塩基はない。開始コドン、終止コドンが句読点にあたるとも言えるが。

下の表は真核生物のコドン表である (上の図とともに、いずれも Public domain) 。原核生物やミトコンドリアでは違った暗号が使われるなど、現在ではさまざまなコドン表が作られている。それらは NCBI のサイトでまとめられている。

例えば、以下はバクテリア、アーキア、および植物の葉緑体で使われているコードである。

TTT F Phe	TCT S Ser	TAT Y Tyr	TGT C Cys
TTC F Phe	TCC S Ser	TAC Y Tyr	TGC C Cys
TTA L Leu	TCA S Ser	TAA * Ter	TGA * Ter
TTG L Leu i	TCG S Ser	TAG * Ter	TGG W Trp
CTT L Leu	CCT P Pro	CAT H His	CGT R Arg
CTC L Leu	CCC P Pro	CAC H His	CGC R Arg
CTA L Leu	CCA P Pro	CAA Q Gln	CGA R Arg
CTG L Leu i	CCG P Pro	CAG Q Gln	CGG R Arg
ATT I Ile i	ACT T Thr	AAT N Asn	AGT S Ser
ATC I Ile i	ACC T Thr	AAC N Asn	AGC S Ser
ATA I Ile i	ACA T Thr	AAA K Lys	AGA R Arg
ATG M Met i	ACG T Thr	AAG K Lys	AGG R Arg
GTT V Val	GCT A Ala	GAT D Asp	GGT G Gly
GTC V Val	GCC A Ala	GAC D Asp	GGC G Gly
GTA V Val	GCA A Ala	GAA E Glu	GGA G Gly
GTG V Val i	GCG A Ala	GAG E Glu	GGG G Gly

なぜコドンは縮重しているのか？

コドンの 3 番目の塩基は tRNA の 1 番目の塩基とペアを形成する。この部位では、他の部位に比べてミスマッチが許容されやすい (3)。そのため、ここでコドンが縮重しているのは、ミスマッチが起きてもアミノ酸が置換されないための防御機構であると考えられる。

また、コドンが縮重していることにより、突然変異の影響を少なくすることができることも一般的なメリットであると考えられる。

同義置換と非同義置換

同じアミノ酸をコードするコドンを同義である synonymus という。塩基の置換のうち、コードされるアミノ酸が変わらないような置換を同義置換 synonymous substitution, そうでない置換を非同義置換 non-synonymous substitution という。両者の比は、遺伝子の進化を考察する上で重要なデータとなる (参考: 同義置換/非同義置換率のページ)。

「あとがき」で当サイトを参考にしたと書いてくれているラノベです。Kindle Unlimited で読めました。ストーリーと文章が良く、面白かったです。

リンク

開始コドン

開始コドンは常にメチオニン methionine をコードする。このコドンが mRNA 中で発見されるメカニズムは、翻訳の読み枠を決める上で非常に重要である。以下のように、真核生物と原核生物で大きな違いがある。

真核生物

真核生物 eukaryote の場合は、1 つの mRNA が 1 つの遺伝子をコードしている (モノシストロン性) ので、翻訳の開始は比較的単純である。すなわち、mRNA の 5' 末端に近い AUG が開始コドンとして認識される。

原核生物

原核生物 prokaryote では、mRNA が複数の遺伝子を含む (ポリシストロン性)。したがって、翻訳の開始点となる AUG が 1 つの mRNA 中に複数存在する。

原核生物の mRNA では Shine-Dalgarno 配列が開始メチオニンの上流に存在し、これが翻訳開始の合図になる。

タンパク質の N 末端に存在するメチオニンは、ホルミル基 (formyl group; 官能基の一覧) で修飾された formylmethionine (fMet) である (2)。

終止コドン

終止コドンには tRNA でなく release factor というタンパク質が結合する。

レアコドンとは

コドンの縮重のため、一つのアミノ酸に対して複数のコドンが存在する場合がある。たとえば、ロイシンは 4 種類のコドンにコードされる。

このような場合、コドンの使用頻度は生物によって異なる。さらに、コドンの使用頻度と tRNA 発現量には、正の相関があると考えられている (1)。かずさ DNA 研究所の Codon Usage Database がコドン使用頻度のデータベースとして有名である。

タンパク質を発現させる際に、宿主として用いる大腸菌や酵母におけるレアコドンが発現配列中に含まれていると、収率が低下する可能性がある。これは、以下のいずれか (または両方) の方法で対処する。

ベクターの配列を変更し、レアコドンを含まないようにする (手間がかかる)。
宿主内で、発現量が少ない tRNA を補充する。つまり、レアコドンの tRNA がコードされているような発現ベクターを使う。

ATGme では、DNA シークエンスとコドン表を submit することで、コドンの使用頻度を調べることができる。コドン表は、上記の Codon Usage Database のものを使用する。

これが解析結果。元の配列に含まれているコドンのうち、レアコドンが赤で、やや使用頻度の低いコドンが黄色で表示される。Optimized sequence として、アミノ酸配列を変えずにレアコドンを除いた配列も示してくれる。

References

pETシステムにおけるタンパク質発現誘導のポイント. Link: Last access 2021/03/20.
Amazon link: ストライヤー生化学: 使っているのは英語の 6 版ですが、日本語の 7 版を紹介しています。参考書のページにレビューがあります。
Amazon link: Pierce 2016. Genetics: A Conceptual Approach: 使っているのは 5 版ですが、6 版を紹介しています。

コメント欄

サーバー移転のため、コメント欄は一時閉鎖中です。サイドバーから「管理人への質問」へどうぞ。

↑