Introduction
토마토(Solanum lycopersicum L.)는 가지과(Solanaceae)에 속하는 대표적인 채소 작물로서, 국내뿐만 아니라 전세계적으로 생산량 및 소비량이 많아 작물 시장에서 높은 경제적 가치를 가진다. 특히 토마토는 Agrobacterium을 통한 형질전환이 가능하고, 비교적 짧은 생활사 및 작은 유전체 크기를 가지고 있어 가지과 작물의 육종 모델로 사용되어 왔다(Foolad, 2007). 최근 토마토의 유전체 해독이 완료되고(The Tomato Genome Consortium, 2012), NGS (Next generation sequencing)를 이용한 대용량 염기서열 생산이 가속화되면서 육종 산업 내 유전체 기반의 분자 육종이 가지는 중요도는 더욱 더 커지고 있다.
분자 육종은 원하는 형질의 유무를 형질에서 유래한 표현형의 관찰 없이 DNA 염기서열의 차이를 보이는 분자 마커(Molecular marker)를 이용하여 판별하는 기법으로(Edwards and Batley, 2010), 전통적 선발 육종 방법에 비해 육종 연한을 단축시키고 우량 개체 선발 효율을 극대화시킬 수 있는 장점을 지니고 있다. 더욱이 분자 마커를 여교잡 육종에 적용하는 분자마커이용여교잡(Maker-assisted backcrossing, MABC)은 분자 마커를 이용하여 유묘기에 여교잡 자손의 염색체 조성을 확인함으로써 신속하고 정확하게 회복친의 염색체 이입개체를 선발할 수 있어 육종 연한과 비용, 노력 등을 효율적으로 감소시킬 수 있다(Servin and Hospital, 2002; Collard and Mackill, 2008). 토마토의 경우 많은 유용 형질 유전자들이 야생종에서 발견되고 있기 때문에(Foolad, 2007), 이러한 MABC 시스템을 활용하면 기존의 육종 기술보다 효율적인 계통의 육성을 기대할 수 있다. 현재 국내에서도 토마토의 내병성 및 주요 형질 연관 마커에 대한 연구와 더불어 MABC 육종 기술을 적용한 사례가 보고되고 있지만(Park et al., 2010a; Park et al., 2010b; Hwang et al., 2012), MABC에 활용할 수 있는 특이적 마커의 선발과 최종적으로 실제 육종 현장에 적용될 수 있는 MABC 기술은 미흡한 실정이다.
최근 MAS 및 MABC에 대표적으로 이용되는 분자 마커는 유전체 내 가장 높은 빈도로 존재하는 단일염기다형성(Single nucleotide polymorphism, SNP)이다. SNP는 국내에서도 토마토의 품종 구분 뿐만 아니라 유용 형질 유전자 선발을 위한 연구에 폭넓게 활용되고 있다(Bae et al., 2010; Hwang et al., 2012). NGS에 기반한 전장유전체재분석(Whole genome resequencing, WGRS)은 비용이 큰 반면 대량의 SNP와 삽입/결실(Insertion/Deletion, Indel)과 같은 염기서열변이 정보를 확보할 수 있는 큰 장점이 있다(Lee et al., 2015). 최근 국제적으로 다양한 토마토 품종에 대한 WGRS이 수행되고 있는데(Causse et al., 2013; Sahu and Chattopadhyay, 2017), Lin et al. (2014)는 총 360개 토마토 핵심 유전자원(core collection)에 대해 WGRS를 완료하였으며, 염기서열 정보는 NCBI의 SRA (Sequence Read Archive; https://www.ncbi.nlm.nih.gov/sra) database에 공시되어 있다.
본 연구는 NCBI-SRA database에 공시된 토마토 유전체 염기서열 정보를 재분석하여 대량 SNP를 탐색하고 이를 이용하여 여교잡 육종 현장에서 활용 가능한 새로운 MABC SNP set를 개발하고자 수행되었다.
Materials and Methods
토마토 유전체 정보의 확보
토마토 유전체 정보는 NCBI의 SRA database로부터 수집하였으며, 본 연구를 위해 수집한 토마토의 계통 별 SRA 정보는 약 800여개, 총 염기서열 정보의 양은 약 7.8 Tb이다(Table 1). 토마토 표준 유전체(reference genome)는 SGN (https://solgenomics.net/)에서 수집한 Solanum lycopersicum Heinz 1706 (ITAG version 2.4)을 사용하였다. 표준 유전체의 총 길이는 781,666,411 bp이고, 12개 염색체와 12개 염색체 중 하나의 염색체로 자리 잡지 못한 scaffold 염기서열을 묶은 1개의 기타 group으로 구성된 13개의 염색체로 이루어져 있다.
토마토 계통의 선정
토마토 집단을 대변하는 계통을 선발하기 위해 Lin et al. (2014)의 논문을 참고하여 연구 및 분석에 사용 가능한 형태의 염기서열 데이터로서 1차적으로 토마토 234개 계통을 선정하였다(Table 2). 이들은 대과종 완숙용 또는 가공용 재배종으로 많이 이용되고 있는 Solanum lycopersicum을 우선으로 하여, 대표적인 방울토마토 재배종인 S. lycopersicum var. cerasiforme와 방울토마토 육종 과정에서 활용도가 높은 S. pimpinellifolium을 포함하였으며, 그 외 일부 야생종 토마토 계통으로 구성되었다. 또한, 선정된 계통을 위주로 교배조합을 작성하여 선발된 SNP 마커의 실효성 검증에 사용되도록 하였다.
토마토 genomic DNA 추출
유전체 분석을 통해 선발한 SNP 마커의 정확도를 검증하기 위해 ‘L3708’ (Solanum pimpinellifolium)과 ‘AV107-4’ (Solanum lycopersicum) 간 교배집단을 작성하였다. Genomic DNA를 추출하기 위해 토마토 잎 1 mg을 1.5 ml microcentrifuge tube에 넣고 액화질소로 냉동시킨 후, pestle을 이용하여 조직을 완전히 마쇄하였다. DNeasy Plant mini kit (Qiagen, USA)의 매뉴얼에 따라 진행하였으며, 추출한 DNA는 SimplinanoTM spectrophotometer (GE Healthcare Life Sciences, UK)를 이용하여 농도와 순도를 측정한 다음 최종 농도가 25 ng·μl-1 가 되도록 희석하였다.
토마토 MABC용 SNP 마커 선발
NCBI-SRA database에서 수집한 토마토 234 계통의 유전체 염기서열 정보로부터 haplotype 유전자 분석을 위한 tag-SNP 27,680좌를 선발하였다. 1차적으로 27,680좌의 tag-SNP로부터 group 전체의 missing data가 30% 이내이고 각 group 내에서 PIC (polymorphism information content) value가 0.2 이상인 tag-SNP를 filtering하였다. 각 tag-SNP의 PIC value는 SNP의 다형성 수준을 나타내는 지표로써 Botstein et al. (1980)를 참고하여 산출하였다.
PICi = 1 - ∑nj =1 Pij2
한 염색체당 최소 10개의 SNP를 선발하고자 각 염색체의 길이를 5 Mb에서 10 Mb 간격으로 영역을 나누었으며, 계산식을 통해 걸러진 tag-SNP의 염색체 영역별 분포 양상을 확인하였다. 최종적으로 해당 영역에서 PIC value가 높고, 교배조합 내에서 다형성을 가장 많이 나타내는 SNP를 선발하였다.
교배조합을 이용한 SNP 마커 검증
각 SNP에 대한 high-resolution melting (HRM) 마커를 디자인하여 GBS 결과의 신뢰성을 검증하였다. 해당 SNP의 특이적 증폭을 위해 약 300 bp 길이의 flanking 서열로부터 PCR primer와 Luna probe 세트를 제작하였다. Primer3 프로그램을 이용하여 AT-rich 혹은 GC-rich region을 피하고 GC 비율은 약 50%로 primer를 설계하였으며, 최종 PCR product의 크기는 해당 SNP가 포함된 150 bp 내외로 하였다. Luna probe는 SNP를 포함하여 총 31 mer로 하며, SNP 위치의 염기는 reference의 염기(기준 염기)로 제작하였다(Table 5). PCR 반응액은 genomic DNA (25 ng/μL) 1 μL와 함께 forward primer (1 pmol) 1 μL, reverse primer (10 pmole) 0.5 μL, 5x HOT FIREPol® EvaGreen® qPCR Supermix (Solis Biodyne, Estonia) 4 μL, luna probe (10 pmole) 1 μL, D.W 12.5 μL를 넣어 총 20 μL로 조성하였다. Real time PCR은 CFX96 (Bio-rad, USA) 기기를 이용하여 수행되었으며, PCR 조건은 95℃에서 5분 동안 1차 변성하고, 95℃에서 20초, 60℃에서 20초, 72℃에서 20초간 40 - 45회 반복하였다. 이어서 melting curve 분석을 위해 95℃에서 15초, 40℃에서 30초 반응한 다음, 50℃에서 90℃까지 1초당 0.5℃씩 온도를 상승시켰다. Melting curve 분석 시 기준이 되는 SNP 서열과 perfect match인 template DNA 샘플은 one miss match인 샘플보다 Tm 값이 낮기 때문에 melting peak이 빨리 출현하게 되어 결과적으로 두 샘플을 구분할 수 있게 되며, 각 계통에 대한 GBS 분석 결과와 HRM 결과를 비교하여 일치율을 백분율로 계산하였다.
Results and Discussion
토마토 유전체 정보를 이용한 계통 선발 및 교배조합의 작성
1차적으로 선발된 234개의 토마토 accession의 경우 재배종으로 이용되고 있는 Solanum lycopersicum 이외에도 유전적 배경이 다양한 야생종들이 포함되어 있기 때문에, 선발된 MABC용 마커가 실제 토마토 육종 과정에서 활용 가능한지 여부를 확인할 필요가 있다. 따라서 234개의 계통 중에서 주요 육종 자원으로 이용되고 다양한 계통을 대변할 수 있는 교배조합의 작성이 매우 중요하다.
NCBI-SRA로부터 얻은 토마토 234개 품종 중에서 재배종으로 이용되는 S. lycopersicum와 S. lycopersicum var. cerasiforme 품종을 포함하여 유전체 데이터의 quality가 충분한 178개 품종을 2차로 선발하였다. 이 후 선발된 178개 품종 중 Lin et al. (2014)의 구분에 따른 대과종 그룹(group = BIG lines)과 소과종 그룹(group = CER lines)에 속하는 품종 94종과 68종, 총 162 품종을 재 선발하였으며, 최종적으로 ‘Cocktail tomato’, ‘Vintage cultivar’, ‘Latin American cultivar’ 등 17가지의 다양한 카테고리에 속하는 124종 (group = CER lines 39종, group = BIG lines 85종)을 선정하여 MABC용 SNP 마커 선발에 사용하였다(Table 3). 육종을 통하여 개량된 품종의 경우 품종명을 표기하였다.
MABC용 SNP 마커 선발
토마토 234 계통의 유전체 염기서열 데이터를 이용하여 haplotype 유전자를 분석하기 위해 tag-SNP 27,680개를 선발한 후, filtering 과정을 거쳐 총 4,274개를 1차적으로 선발하였다. 그 다음으로 각 염색체를 5 Mb 단위로 영역을 나누었으며, 해당 영역에서 높은 PIC value를 갖는 143개 tag-SNP를 최종적으로 선발하였다(Table 4, Supplemental Table 1). 최종 선발된 143개 마커의 염색체 별 분포 양상을 재확인하기 위해 표준 유전체를 이용하여 mapping 분석을 수행한 결과, 12개의 토마토 염색체 상에 전반적으로 고루 분포하는 것을 확인할 수 있었다(Fig. 1).
효과적인 MABC를 위해서는 먼저 유전체 전체적(genome-wide)으로 분포하고 있는 분자 마커를 확보해야 하며, 교배조합에 따라 적용 가능한 마커를 쉽게 확인할 수 있어야 한다. 또한 genotyping에 필요한 분자 마커만을 선발하여 분석에 소요되는 비용을 최소화하여야 한다(Kim et al., 2013). 따라서 본 연구에서는 단순히 SNP를 임의로 선발하여 사용하던 기존의 방법과 달리, 인간 유전체 분야에서만 사용되던 tag-SNP를 사용함으로써 각 교배집단들의 유전체 조성을 좀 더 효율적으로 대변하고자 하였다. Tag-SNP 기술은 유전자 영역에 존재하는 SNP 중 염색체 블록(block) 단위에서 넓은 범위로 일차 선발하고, 그 중에서 아미노산의 치환으로 단백질 구조 변화를 야기하여 유전자 기능에 영향을 미칠 가능성이 높은 비동의 SNP (non-synonymous SNP)를 이용하는 것을 말한다.
MABC용 SNP 마커 토마토 개체 내 다형성 분석
다형성 지수(PIC)가 높은 마커일수록 개체의 식별뿐만 아니라 유전적 다양성을 평가하기에 매우 유용하다. 최종 선발된 143개 MABC용 tag-SNP 마커의 PIC value는 평균 0.369로 비교적 높고 모든 염색체에 대하여 균일한 값을 나타내었다(Table 4). 또한 선발된 SNP의 MABC용 마커로서의 활용 가능성을 평가하기 위해 124개 품종 간 교배조합을 가상으로 작성(pairwise cross-combination matrix)하고 각 교배조합 당 다형성을 보이는 SNP의 수를 확인하였다(Fig. 2). SNP의 수는 pairwise box의 색도차로 나타내었는데 색이 짙을수록 더 높은 SNP 수를 의미한다. SNP의 수가 많을 수록 특정 교배조합의 양친 간 유전적 거리가 크다는 것을 짐작할 수 있는데, S. lycopersicum와 S. lycopersicum var. cerasiforme 품종 간 조합의 경우 pairwise box의 색이 비교적 짙다는 사실에서 증명된다. 전반적으로 선발된 143개의 MABC 마커 대부분이 124개 품종 간에 높은 다형성을 나타내는 것을 확인할 수 있었다(Fig. 2A).
Table 4. Summary of MABC. |
|
MABC, Marker-assisted Backcrossing; SNP, Single Nucleotide Polymorphism; CDS, Coding sequence; PIC, Polymorphism Information Content. |
특히 124 품종 중 S. lycopersicum (Group = BIG) 14개, S. lycopersicum var. cerasiforme (Group = CER) 5개를 선발하여 재분석 하였을 경우(Fig. 2B) 동일 그룹 내의 품종 간 교배조합에서도 높은 SNP 수가 존재하였으며, 이는 그룹 간 교배조합의 경우와 크게 다르지 않았다. 이는 선발된 SNP가 대과종(S. lycopersicum)과 소과종(S. lycopersicum var. cerasiforme) 간 MABC 뿐만 아니라 동일한 아종 내 품종 간 MABC에도 효과적으로 활용될 수 있음을 의미하는 결과이며, 실제 다양한 교배조합에 공통적으로 적용될 가능성이 매우 높은 SNP set을 임을 보여준다. 단 국내 상용 F1 품종 육성에 활용되는 토마토 유전자원의 유전적 다양성이 본 연구의 NCBI-SRA DB로부터 선발한 품종에서보다 낮을 것임을 예측할 때 다양한 국내 F1 품종을 이용한 SNP set의 적용성 검증이 향후 필요하리라 본다.
Luna probe를 이용한 SNP 마커 정확성 검증
SNP 신뢰성 검증을 위해 Solanum lycopersicum 과 S. pimpinellifolium 에 속하는 품종 간의 교배조합에서 다형성을 나타내는 SNP를 염색체 당 1 - 2개 선발하였다. MABC 마커의 경우 PIC value가 0.3 이상인 값을 기준으로 하여 filtering 과정을 수행하였지만, Luna probe 검증에 사용한 SNP의 경우 다양한 PIC value (0.02 - 0.38)를 가지는 것으로 선발하였다(Table 5). 이렇게 선발된 18개의 마커를 이용하여 교배조합의 양친 2 품종과 F1 5 품종에 대하여 genotyping을 수행하였고, 그 결과 모든 마커에 대하여 melting peak가 구분되는 것을 확인하였다. 특히, NCBI-SRA의 염기서열 정보를 분석하여 얻은 SNP에 대해 동형접합(homozygosity)의 유전자형을 보인 품종의 경우 정확하게 단일 peak가 나타난 반면, 이형접합(heterozygosity)이었던 품종들의 melting peak는 완만한 곡선을 보이며 두 대립유전자형에 대한 이중성을 나타냈다(data not shown). 결과적으로 7개 품종에 대해 18개의 HRM 마커를 검증하여 총 126개의 genotype data point를 얻었고, 그 중 125개의 SNP data point에서 염기서열정보와 HRM 검증 결과가 일치하는 것을 확인할 수 있었다(Table 6). 따라서 본 연구팀의 분석 파이프라인을 통한 NCBI-SRA database의 염기서열정보 분석 및 SNP 탐색 결과가 매우 신뢰성이 있음을 알 수 있었다.
Table 5. Information of Luna probe used for SNP genotyping. |
|
SNP, Single Nucleotide Polymorphism; PIC, Polymorphism Information Content. |
Table 6. Comparison of SNP genotyping results using 18 Luna probe. |
|
‘-’ means no read. SNP, Single Nucleotide Polymorphism. |
Real-time PCR을 이용한 HMR 방식의 SNP 유전자형 분석법은 CAPS 또는 dCAPS와 같은 gel-based 유전자형 분석법에 비해 자동화가 가능하고 시간과 비용을 절감할 수 있다. 본 연구에서는 유전체 분석을 통해 선발된 SNP 마커의 정확성을 검증하고, 이를 실제 육종에 적용할 수 있을지 판단하기 위해 Luna probe (unlabeled probe)와 Eva green을 이용하는 melting curve 분석에 기반한 HRM genotyping 시스템을 구축하였다. Luna probe는 FRET (fluorescence resonance energy transfer) probe 방식을 이용하며, 3’말단에 phosphate를 처리하여 polymerase에 의한 nucleotide 합성을 방지하고, 해당 SNP의 결합 여부에 따라 melting peak에서 나타나는 Tm 값의 차이로 SNP 타입을 구분할 수 있게 된다(Zhou et al., 2004). 특히 NGS에 기반한 Genotyping-by-sequencing (GBS) 분석 기술이 빠르게 확산되면서 토마토를 비롯한 여러 작물에 대하여 폭넓은 연구가 이루어지고 있으며(Elshire et al., 2011; Labate et al., 2014; Jang and Oh, 2017), 이에 따라 다양한 형질과 연관된 SNP가 꾸준히 개발되고 있다. 그럼에도 불구하고 대량의 SNP를 정확하고 효율적으로 검증할 수 있는 시스템은 미진한 상태이다. 현재까지 Luna probe를 HRM genotyping에 적용한 사례가 많지는 않지만(Liew et al., 2007; Costa et al., 2012; Birrer et al., 2014; Zhong et al., 2016), 이용의 편의성과 결과의 신뢰성을 고려할 때 식물에서도 다양한 조건의 SNP와 indel 등의 염기서열변이 판별에 충분히 활용 가능하리라 판단된다.
이와 같이 본 연구에서는 공시된 대량 토마토 유전체 염기서열 정보를 재분석하여 토마토 MABC 육종에 활용 가능한 tag-SNP set를 개발하였다. 또한 여교잡 육종 현장에서 활용될 수 있는 가상의 양친을 대상으로 개발된 tag-SNP set의 적용성을 검증하였다. 본 연구를 통해 개발된 MABC 마커 세트는 토마토 여교배집단에서 반복친의 염색체 회복율이 높은 후대를 조기에 효율적으로 선발할 수 있을 뿐만 아니라 품종 식별과 F1 품종의 순도 검정용 마커로도 활용 가능하리라 본다.
Conclusion
분자마커이용여교잡(MABC)은 분자 마커를 이용하여 유묘기에 여교잡 자손의 염색체 전체 조성을 확인함으로써 육종 연한과 비용, 노력 등을 효율적으로 감소시킬 수 있어 목표 형질 유전자의 선발 육종에 매우 적합하다. 그러나 벼를 비롯한 작물을 대상으로 다양하게 연구되고 있는 것과 달리, 실제 육종 산업에 적용될 수 있는 MABC 기술은 매우 미흡하다고 볼 수 있다. 본 연구에서는 토마토 유전자 단위에서 haplotype을 구분하는 tag-SNP 27,680개를 선발하여 마커 선발에 이용하였으며, 실제 토마토의 MABC 육종에 활용될 수 있는 마커 세트를 개발하기 위해 수행되었다. 234개의 SRA 토마토를 이용하여 염색체 내 일정 간격(5 - 10 Mb)으로 영역을 나눈 후, filtering을 거쳐 PIC value 가 높은 SNP로써 총 143개의 MABC용 후보 SNP를 선발하였다. 이렇게 선발된 143개 MABC 마커는 유전적으로 다양한 계통으로 이루어진 교배집단 124 계통 내에서 높은 다형성을 나타내는 것을 확인하였다. 또한, 해당 MABC 마커의 활용 가능성을 검증하기 위해 선발된 18개의 MABC용 SNP 마커와 Luna probe를 이용하여 real-time PCR 분석을 수행하였고, 결과적으로 염기서열 분석 결과와 실험적 결과가 100% 일치하는 것을 확인할 수 있었다. 따라서 본 연구를 통해 선발된 MABC 마커 세트는 실제 다양한 여교잡 교배조합에 활용될 수 있는 가능성을 높임과 동시에 토마토 품종 육성에 있어서 경쟁력을 크게 향상시킬 수 있으므로 상업적으로 매우 유용하게 이용될 수 있을 것으로 기대된다.