궤적 추론
Trajectory inference궤적 추론 또는 의사 측두순서는 단세포 전사체학에서 세포에 의해 경험되는 동적 과정의 패턴을 결정하고 그 과정을 통해 세포들의 진행에 기초하여 세포를 배열하기 위해 사용되는 계산 기술이다.단일 세포 프로토콜은 벌크 RNA-seq보다 [1]훨씬 높은 수준의 노이즈를 가지고 있으므로, 단일 세포 전사체 워크플로의 공통 단계는 세포를 [2]하위 그룹으로 클러스터링하는 것이다.클러스터링은 셀 [3]타입의 식별을 가능하게 하면서 많은 셀로부터의 신호를 조합함으로써 이러한 본질적인 변화에 대처할 수 있습니다.하지만, 세포들 사이의 유전자 발현에서의 몇몇 차이는 세포 주기, 세포 분화 또는 외부 자극에 대한 반응과 같은 동적 과정의 결과이다.궤적 추론은 셀을 이산 [4]클러스터로 분할하기보다는 프로세스의 진화를 나타내는 연속 경로를 따라 셀을 배치함으로써 그러한 차이를 특징짓는 것을 추구한다.일부 방법에서 이것은 셀을 의사 시간이라고 불리는 축에 투영함으로써 수행되며,[5] 이는 프로세스 전체의 진행을 나타냅니다.
방법들
2015년 이후 궤적 추론을 위한 50개 이상의 [6]알고리즘이 만들어졌다.채택되는 접근법은 다양하지만 방법에는 몇 가지 공통점이 있다.일반적으로 알고리즘의 단계는 데이터의 복잡성을 줄이기 위한 차원 감소, 동적 프로세스의 구조를 결정하기 위한 궤적 구축 및 궤적에 대한 데이터 투영으로 구성되며 셀은 프로세스를 통한 진화에 의해 배치되고 유사한 표현 프로파일을 가진 셀은 상황에 놓인다.서로 [6]가까이 다가갔다.궤적 추론 알고리즘은 차원 축소를 위해 사용되는 특정 절차, 동적 과정을 나타내기 위해 사용될 수 있는 구조의 종류 및 요구되거나 [2]제공될 수 있는 사전 정보에서 다르다.
치수 축소
단세포 RNA-seq에 의해 생성된 데이터는 각각 수천 개의 유전자에 [7]걸쳐 기록된 발현 수준을 가진 수천 개의 세포로 구성될 수 있다.이와 같이 높은 차원의 데이터를 효율적으로 처리하기 위해 많은 궤적 추론 알고리즘은 첫 번째 [8]단계로 주성분 분석(PCA), 독립성분 분석(ICA) 또는 t-SNE와 같은 차원 축소 절차를 사용한다.이 단계의 목적은 데이터의 많은 기능을 보다 유용한 [4]측정값으로 결합하는 것입니다.예를 들어, 차원 감소로 인한 좌표는 세포 주기와 관련된 많은 유전자의 발현 수준을 세포 [8]주기에서 세포의 위치를 나타내는 하나의 값으로 결합할 수 있다.이러한 변환은 피쳐 공간의 차원 축소에 해당하지만 차원 축소는 유사한 [1]셀의 그룹을 함께 클러스터링하여 샘플 공간에도 적용할 수 있습니다.
궤적 빌딩
그래프 기반 접근방식을 통해 동적 프로세스의 구조를 나타내는 방법이 많습니다.이러한 접근방식에서 그래프의 정점은 셀 분화의 셀 타입과 같은 동적 프로세스 상태에 대응하고 노드 간의 엣지는 상태 간의 [6]천이에 대응한다.궤적 그래프의 작성은 k-근접 네이버 또는 최소 스패닝트리 [9]알고리즘을 사용하여 수행할 수 있습니다.궤적의 토폴로지는 그래프의 구조를 나타내며, 다른 알고리즘은 선형, 분기 또는 [4]순환과 같은 특정 유형의 그래프 토폴로지를 생성하는 것으로 제한됩니다.
사전정보의 이용
일부 방법은 궤적 생성을 유도하는 데 사용되는 사전 정보의 입력을 요구하거나 허용한다.사전 정보를 사용하면 보다 정확한 궤적을 결정할 수 있지만, 사전 정보가 부족하면 알고리즘이 잘못되거나 결과가 [6]기대치에 치우칠 수 있습니다.궤적 추론에 사용할 수 있는 사전 정보의 예로는 궤적의 시작 부분에 있는 시작 셀의 선택, 궤적의 분기 수 및 [10]궤적에 대한 끝 상태의 수가 있다.
소프트웨어
마가렛
MARGARET은 세포 잠복 공간과 세포 클러스터를 추론하기 위해 심층 비감독 메트릭 학습 접근방식을 사용한다.궤적은 클러스터 연결 그래프를 사용하여 모델링되어 복잡한 궤적 토폴로지를 캡처합니다.MARGARET은 확장 가능한 흡수 마르코프 연쇄 [11]모델을 사용하여 말단 상태를 결정하고 세포 운명의 가소성을 추론하기 위해 추론된 궤적을 이용한다.
모노클
모노클은 우선 유전자 수를 줄이기 위해 미분발현 테스트를 실시한 후 추가적인 차원 감소를 위해 독립적인 성분 분석을 적용한다.궤적을 구축하기 위해 모노클은 최소 스패닝 트리를 계산한 다음 해당 트리에서 가장 긴 연결 경로를 찾습니다.세포는 그 [5]경로를 따라 가장 가까운 지점에 투영됩니다.
p-크리드
p-Creode는 밀도 조정된 k-근접 인접 그래프를 통해 가장 가능성이 높은 경로를 찾습니다.가장 대표적인 토폴로지를 선택하기 위해 그래프 유사도 메트릭을 사용하여 그래프를 채점합니다.p-Creode는 질량 세포 측정, 다중 면역 형광 [12]및 단세포 RNA-seq를 포함한 다양한 단세포 플랫폼에서 테스트되었습니다.사전 정보는 [13]필요 없습니다.
슬링샷
슬링샷은 클러스터 라벨을 입력으로 사용하여 최소 스패닝트리를 구축하여 이들 클러스터를 라인지로 정렬합니다.트리를 통과하는 경로는 동시 주곡선을 맞춤으로써 평활화되고 셀의 의사시간 값은 이러한 곡선 중 하나 이상의 투영에 의해 결정됩니다.초기 및 터미널 클러스터 등의 이전 정보는 옵션입니다.[10]
TSCAN
TSCAN은 주성분 분석을 사용하여 치수 축소를 수행하고 혼합 모델을 사용하여 셀을 클러스터링합니다.클러스터의 중심을 이용해 최소 스패닝 트리를 계산하고, 그 트리의 최장 접속 경로로서 궤적을 결정한다.TSCAN은 사전 정보가 [14]필요 없는 비감독 알고리즘입니다.
방랑자/위시본
Wandlerst는 질량 세포 측정 데이터 분석을 위해 개발되었지만, 단세포 전사체 애플리케이션에 적합하게 적용되었다.k-근접 인접 알고리즘은 유클리드 거리 또는 코사인 거리 등의 메트릭에 관해 모든 셀과 셀에 가장 가까운 셀을 연결하는 그래프를 구축하기 위해 사용된다.Wandlust는 시작 셀을 사전 [15]정보로 입력해야 합니다.
Wishbone은 Wandlerst에 구축되어 그래프 토폴로지에서 분기할 수 있는 반면 Wandlerst는 선형 그래프를 만듭니다.Wishbone은 주성분 분석과 확산 지도를 결합하여 치수 감소를 달성한 다음 KNN 그래프를 [16]만듭니다.
폭포
Waterpol은 주성분 분석을 통해 치수 감소를 수행하고 k-평균 알고리즘을 사용하여 셀 클러스터를 찾습니다.최소 스패닝 트리가 클러스터의 중심 사이에 구축됩니다.폭포는 전혀 감독되지 않아 사전 정보가 필요하지 않으며 선형 [17]궤적을 생성합니다.
레퍼런스
- ^ a b Bacher, Rhonda; Kendziorski, Christina (2016-04-07). "Design and computational analysis of single-cell RNA-sequencing experiments". Genome Biology. 17 (1): 63. doi:10.1186/s13059-016-0927-y. ISSN 1474-760X. PMC 4823857. PMID 27052890.
- ^ a b Hwang, Byungjin; Lee, Ji Hyun; Bang, Duhee (2018-08-07). "Single-cell RNA sequencing technologies and bioinformatics pipelines". Experimental & Molecular Medicine. 50 (8): 1–14. doi:10.1038/s12276-018-0071-8. ISSN 2092-6413. PMC 6082860. PMID 30089861.
- ^ Stegle, Oliver; Teichmann, Sarah A.; Marioni, John C. (2015-01-28). "Computational and analytical challenges in single-cell transcriptomics". Nature Reviews Genetics. 16 (3): 133–145. doi:10.1038/nrg3833. ISSN 1471-0056. PMID 25628217. S2CID 205486032.
- ^ a b c Cannoodt, Robrecht; Saelens, Wouter; Saeys, Yvan (2016-10-19). "Computational methods for trajectory inference from single-cell transcriptomics". European Journal of Immunology. 46 (11): 2496–2506. doi:10.1002/eji.201646347. ISSN 0014-2980. PMID 27682842. S2CID 19562455.
- ^ a b Trapnell, Cole; Cacchiarelli, Davide; Grimsby, Jonna; Pokharel, Prapti; Li, Shuqiang; Morse, Michael; Lennon, Niall J; Livak, Kenneth J; Mikkelsen, Tarjei S (2014-03-23). "The dynamics and regulators of cell fate decisions are revealed by pseudotemporal ordering of single cells". Nature Biotechnology. 32 (4): 381–386. doi:10.1038/nbt.2859. ISSN 1087-0156. PMC 4122333. PMID 24658644.
- ^ a b c d Saelens, Wouter; Cannoodt, Robrecht; Todorov, Helena; Saeys, Yvan (2019-01-04). "A comparison of single-cell trajectory inference methods". Nature Biotechnology. 37 (5): 547–555. doi:10.1038/s41587-019-0071-9. PMID 30936559. S2CID 89616753.
- ^ Conesa, Ana; Madrigal, Pedro; Tarazona, Sonia; Gomez-Cabrero, David; Cervera, Alejandra; McPherson, Andrew; Szcześniak, Michał Wojciech; Gaffney, Daniel J.; Elo, Laura L. (2016-01-26). "A survey of best practices for RNA-seq data analysis". Genome Biology. 17 (1): 13. doi:10.1186/s13059-016-0881-8. ISSN 1474-760X. PMC 4728800. PMID 26813401.
- ^ a b Yosef, Nir; Regev, Aviv; Wagner, Allon (November 2016). "Revealing the vectors of cellular identity with single-cell genomics". Nature Biotechnology. 34 (11): 1145–1160. doi:10.1038/nbt.3711. ISSN 1546-1696. PMC 5465644. PMID 27824854.
- ^ Cahan, Patrick; Tan, Yuqi; Kumar, Pavithra (2017-01-01). "Understanding development and stem cells using single cell-based analyses of gene expression". Development. 144 (1): 17–32. doi:10.1242/dev.133058. ISSN 1477-9129. PMC 5278625. PMID 28049689.
- ^ a b Street, Kelly; Risso, Davide; Fletcher, Russell B.; Das, Diya; Ngai, John; Yosef, Nir; Purdom, Elizabeth; Dudoit, Sandrine (2018-06-19). "Slingshot: cell lineage and pseudotime inference for single-cell transcriptomics". BMC Genomics. 19 (1): 477. doi:10.1186/s12864-018-4772-0. PMC 6007078. PMID 29914354.
- ^ Pandey, Kushagra; Zafar, Hamim (2022). "Inference of cell state transitions and cell fate plasticity from single-cell with MARGARET". Nucleic Acids Research. doi:10.1093/nar/gkac412. ISSN 0305-1048.
- ^ Gerdes, M. J.; Sevinsky, C. J.; Sood, A.; Adak, S.; Bello, M. O.; Bordwell, A.; Can, A.; Corwin, A.; Dinn, S. (2013-07-01). "Highly multiplexed single-cell analysis of formalin-fixed, paraffin-embedded cancer tissue". Proceedings of the National Academy of Sciences. 110 (29): 11982–11987. Bibcode:2013PNAS..11011982G. doi:10.1073/pnas.1300136110. ISSN 0027-8424. PMC 3718135. PMID 23818604.
- ^ Lau, Ken S.; Coffey, Robert J.; Gerdes, Michael J.; Liu, Qi; Franklin, Jeffrey L.; Roland, Joseph T.; Ping, Jie; Simmons, Alan J.; McKinley, Eliot T. (2018-01-24). "Unsupervised Trajectory Analysis of Single-Cell RNA-Seq and Imaging Data Reveals Alternative Tuft Cell Origins in the Gut". Cell Systems. 6 (1): 37–51.e9. doi:10.1016/j.cels.2017.10.012. ISSN 2405-4712. PMC 5799016. PMID 29153838.
- ^ Ji, Zhicheng; Ji, Hongkai (2016-05-13). "TSCAN: Pseudo-time reconstruction and evaluation in single-cell RNA-seq analysis". Nucleic Acids Research. 44 (13): e117. doi:10.1093/nar/gkw430. ISSN 0305-1048. PMC 4994863. PMID 27179027.
- ^ Bendall, Sean C.; Davis, Kara L.; Amir, El-ad David; Tadmor, Michelle D.; Simonds, Erin F.; Chen, Tiffany J.; Shenfeld, Daniel K.; Nolan, Garry P.; Pe'Er, Dana (2014-04-24). "Single-Cell Trajectory Detection Uncovers Progression and Regulatory Coordination in Human B Cell Development". Cell. 157 (3): 714–725. doi:10.1016/j.cell.2014.04.005. ISSN 0092-8674. PMC 4045247. PMID 24766814.
- ^ Setty, Manu; Tadmor, Michelle D; Reich-Zeliger, Shlomit; Angel, Omer; Salame, Tomer Meir; Kathail, Pooja; Choi, Kristy; Bendall, Sean; Friedman, Nir (2016-05-02). "Wishbone identifies bifurcating developmental trajectories from single-cell data". Nature Biotechnology. 34 (6): 637–645. doi:10.1038/nbt.3569. ISSN 1087-0156. PMC 4900897. PMID 27136076.
- ^ Shin, Jaehoon; Berg, Daniel A.; Zhu, Yunhua; Shin, Joseph Y.; Song, Juan; Bonaguidi, Michael A.; Enikolopov, Grigori; Nauen, David W.; Christian, Kimberly M.; Ming, Guo-li; Song, Hongjun (2015-09-03). "Single-Cell RNA-Seq with Waterfall Reveals Molecular Cascades underlying Adult Neurogenesis". Cell Stem Cell. 17 (3): 360–372. doi:10.1016/j.stem.2015.07.013. ISSN 1934-5909. PMC 8638014. PMID 26299571.