DNA가 유전자임을 발견한 이래로, 최근엔 DNA보다는 protein이 주로 연구되고 있습니다만...

DNA는 막강한 세포 조작법임에는 변함없습니다.

 

초기에 인간 지놈 프로젝트가 발동되었을때는, 30bp를 어떻게 해석할까... 를 하다가, 샷건방법을 쓰기로 했습니다.
clone based shotgun methods 라는 건데요.
차례대로 설명하자면, DNA에 알려진 조각 200~500bp에 달하는 single strand DNA, 즉 외가닥 DNA가 붙는 부위를 마커로 삼아서(Sequence tagged site : STS) 표지를 합니다. 그리고 STS부위의 DNA를 STS염색체별로 무작위로 모조리 다 끊어놓죠. 그다음 오버랩 되는 부위를 토대로 다시 만들어가는데, STS부위가 정확한 표지가 되어줍니다.

간단히 말하자면..

A-b-c-D-e-f-g-H-i-j-K-l-m-n-o-p(대분자가 STS부위)

1.A-b-c
       b-s-D-e

2.D-e-f
   D-e
        e-f-g
           f-g-H-i
3. 4. 5.....

이런식으로 오버랩 되는 부위를 짜맞춰갑니다.


STS부위가 몇번 염색체 어느 부위에 붙는지 미리 추적해놨기때문에 오버랩된 부위가 어디에 있는지 알 수 있습니다.
말이야 간단하지, 각각의 clone을 플라스미드에 짜맞추고, 복제한다음 시퀀스 하는 짓이 좀 많이 생노가다 입니다.

그러나, 10년이 걸리도록 이 프로젝트는 완성이 되지 않았고, 지놈프로젝트에 참여하던 크레이그 벤터는 '이런 노가다 말고 좀 더 효율적인 방법이 있다.' 라고 했지만, 묵살되었죠. 그래서 크레이그는 거기서 나와서 새로 회사를 차리고 자신만의 방법으로 지놈 시퀀스를 해나갑니다.

 

 이름하여 whole genome shotgun methods입니다.
이방법은 STS같은 표지 없이 그냥 전체 지놈을 모조리 깨버린 다음 짜맞추는 방법입니다. (아, 몰라! ㅆ!!!)

 

a-b-c-d-e-f-g-h-i-j-k-l-m-n-o-p
이걸

a-b-c
   b-c-d-e
                                 l-m-n-o
         d-e-f-g-h
               f-g-h-i-j-k-l

 

이런 방식이죠. STS를 세워놓고 시퀀싱하는게 아니라, STS의 영역도 시퀀싱 하는 겁니다.


그리하여 크레이그 박사는 10년이 걸려도 완성되지 않던 지놈 프로젝트를 7개월만에 완성하고는 지놈프로젝트 종료를 선언합니다.
물론, 빠른대신에 정확성은 떨어집니다.

 

1번 염색체에 b-c-d-c-d-e같은 서열이 있고, 8번 염색체에 c-d-c-d-e-f같은 서열이 있으면,
이게 1번에 붙어야 하는지 8번에 붙어야 하는지 잘못될 가능성도 있고,

서열중에 -a-b-a-b-a-b-a-b-c 같은 서열이 있으면, 이게 똑같은 서열이 몇번 반복이 되는건지 알 수 없습니다.

지놈을 깨버리니까, 엉뚱한데서 있다고 분석해버릴 수도 있죠.

그래서 사실은 여태껏 지놈도 100%완벽하게 밝혀내진 않은 상태입니다.

 

 

사실 읽는 과정에서도 오류가 있을 확률이 남아있어서, 개인별로 염기서열이 하나씩 다른 SNP를 추적할 때에도 확률을 씁니다.
SNP란, 개인별로 염기서열이 다른부분이 있습니다. 누구는 어디어디 부위가 AGGGTCTC인데, 누구는 AGGCTCTC, 누구는 AGGTTCTC 이런식으로요.  94%시에 SNP는 몇개, 97%시에 SNP는 몇개.. 이런식으로 추적하는데. 현재 인간 DNA를 다 읽는다는것은 말그대로 하나씩 다 읽는게 아니라, 미리 밝혀놓은 DNA 시퀀스 마커가 있기때문에 가능합니다. SNP맵도 %별로 위치가 대충 밝혀졌기때문에 그 기준을 세워놓고 그부분만 읽는거지요.

사실 여태껏 특정한 마커가 없어서 밝히지 못하는 부위가 일부 존재합니다.

 

  시퀀스 방법은 현재 5세대까지 나와있습니다. 하지만, 대학연구실 같은데는 아직 쉽고 싸고 간단한 Sanger의 방법을 자동화 시키는 방법을 씁니다.

 

방법은 대강 이렇습니다.

AGGGGTTGTCCTGAATGC
TCCCCAACAGGACTTACG


같은것이 서열이 있으면, 이것을 열로 각 가닥간의 수소결합을 풀어버립니다.

그럼 여기에 polymerase하고, dNTP, ddNTP를 둘 다 넣는데, dNTP는 정상적으로 상보적인 결합을 형성하지만, ddNTP는 3'자리에 OH기가 없어서 후속 염기가 와서 달라붙지 못합니다. 여기에 ATGC별로 각각 다른 형광색을 발색하도록 표지를 넣습니다.

그러면 확률적으로 이렇게 만들어지죠.


A
TCCCCAACAGGACTTACG

AG
TCCCCAACAGGACTTACG

AGG
TCCCCAACAGGACTTACG

AGGG
TCCCCAACAGGACTTACG

AGGGG
TCCCCAACAGGACTTACG

AGGGGT
TCCCCAACAGGACTTACG

AGGGGTT
TCCCCAACAGGACTTACG

AGGGGTTG
TCCCCAACAGGACTTACG

AGGGGTTGT
TCCCCAACAGGACTTACG


  이런식이죠. 그러면 각 염기가 하나 더붙고 안붙고로 미세한 분자량 차이가 나므로, 이걸 electrophoresis라는 방법으로 전부 다 분리합니다.
  그럼 윗쪽 순으로 차례대로 나열되는데, 그럼 차례대로 형광빛을 읽으면 되는 겁니다.

 

  단 너무 길어도 결과가 개판이 나오기때문에 몇천 bp정도의 단위만 쓸 수 있기때문에, DNA를 다 박살내서 읽는 방법을 택합니다.

  그리고 위처럼, 똑같은 염기가 몇개씩 나오면 가끔 판독 오류도 나지요. 그래프로 그려보면 좀 아슬아슬하거든요. 대신에 실험실에서도 간단하게 할 수 있고, 장비도 비교적 싸기때문에 많이 쓰는 방법입니다.

 

  5세대 시퀀싱은 여러 방법이 있지만, 이런 방법도 있습니다. 간략하게 말하자면...
polymerase가 dNTP를 붙일때 PPi그러니까, 인산 2개가 나오는데, 이것을 APS로 생체연료인 ATP로 만드는 효소와 luciferase를 같이 넣어주면,  dATP, dTTP, dGTP, dCTP를 차례대로 DNA 위로 흘려주면, 맞는 dNTP가 DNA에 조립 되었을때는 luciferase에서 빛이 나오게 되죠.
 그러면, 그걸로 차례대로 염기서열을 읽어나는 방식으로 진행됩니다.
pyrosequencing이란 방법입니다.

 

이번에 새로 나온 방법은 또 6~7세대쯤 되겠죠.

 시퀀싱은 지금도 1~2주만에 완성할 수 있습니다. 과거 인간 지놈 프로젝트 덕분에요. 그리고 지금은 몇시간만에 완성하는 방법이 나왔다고 하죠.


 인간 DNA는 생각외로 그 바리에이션이 좁습니다. 몇만개 자리의 딱 하나의 염기만이 달라져 있지요. 그래서 SNP는 single nucleotide polymporphims의 약자 입니다. 딱 하나 차이나는게 몇만개 위치에 있다는 것이지요. 물론, 시퀀싱 오류율 오차를 엄하게 적용하면 SNP는 줄어듭니다. 위에도 말했듯이, 100% 정확한게 아니라 확률문제니까요. 30억 bp씩이나 읽다보면 99.999% 정확도로 읽을 수 있다해도 틀린게 몇백만에 달하게 되니까, 요건 어쩔 수 없는 문제...

 

이렇게 대략적인 지도만 만들어져 있으면 활용도가 높아집니다. 그때부터 각 생물의 유전자를 맘대로 할 수 있다는 가능성이 시작이 되는 겁니다. 쥐의 특정 유전자를 Knockout 시킬 수 있는것도 쥐의 지놈이 다 밝혀졌기 때문에 가능한것이구요. 물론 살아있는 세포의 DNA를 조작해서 도로 집어넣는 방법은 아니고..

 

사실 방법이 없는건 아닙니다만... 사람 상대로 쓰긴 좀 그런 방법이고...

 

  그것도 일부 조직에서만 한정해서 쓸 수 있는 방법이고, 몸 전체에서 그 DNA를 완전히  넉아웃 시키기 위한 방법이라면, 대개 1대째 정상 쥐를 교배시켜서, 배반포에서 세포 몇개를 취한다음, 이미 밝혀진 지놈으로 Recombinase와 합성한 DNA서열 몇십bp 를 넣어서 Flank 시킨다음, 성공했는지 안했는지는 모르지만, 일단 세포에 도로 넣어서 배반포에 집어넣으면, 한 개체내에 조작된 유전자의 세포와 조작되지 않은 유전자 의 세포를 가진 2대째 chimeric mouse가 만들어집니다. 운 좋으면 조작된 유전자의 세포가 생식세포로 분화했을 수도 있습니다. 아니면? 한번 또 교배시켜 봐야죠.

 
  3대째에서 조작된 유전자로 개체가 만들어져도, 상동염색체란 것이 있어서, 이것들을 또 교배시켜서, 4대째 중에 완전히 knockout된 쥐를 골라냅니다. 말로해서 그렇지, 실제로 해보면 상당히 방법이 복잡한 탓에 주문을 하면 몇달 걸리고, 새로 만들때는 천만원 상당하는 가격이 들어갑니다. 어쨌든 이렇게 만들 수 있는 것도 마우스 지놈이 완성되었기 때문이고, 우리는 이걸 아주 잘 쓰고 있죠. 쥐 입장에서는 안좋을지도 모르겠습니다만... 


 

 이런 고세대 지놈시퀀싱은 언제쯤 일반 병원에도 들여놓을 정도로 싸질지는 모르겠습니다만, 현재로서는 기술만 발전하고 이용하는 곳은 부자 연구소, 혹은 병원 뿐이지만,  일반화가 된다면, 유전병의 조기발견 및 치료의 표적을 정할 수 있겠지요. 일단 DNA가지고 뭘 하든, 지놈맵을 만들지 않으면 아예 시작부터 어렵습니다.

Hominis Possunt Historiam Condonare, Sed Deus Non Vult