전통문화대전망 - 중국 전통문화 - 단일 세포 RNA-seq 클러스터링 분석: 통합
단일 세포 RNA-seq 클러스터링 분석: 통합
목표:
과제:
권장 사항:
일반적으로 정렬 필요 여부를 결정하기 전에 통합 없이 클러스터를 확인합니다. 차이가 있을 수 있다고 생각하기 때문에 항상 통합-데이터 탐색을 수행하지 마십시오. Seurat 객체에서 두 조건을 함께 정규화하고 세포 간의 유사성을 시각화하면 조건별 클러스터를 볼 수 있습니다. < P > 일반적으로 정렬이 필요한지 여부를 결정하기 전에 통합되지 않은 클러스터를 먼저 확인해야 합니다. 차이가 있을 수 있다고 생각하지 말고 통합 수행-데이터 탐색. Seurat 개체에서 이 두 조건을 동시에 정규화하고 세포 간의 유사성을 시각화하면 < P > 서로 다른 조건에서 세포 클러스터를 볼 수 있습니다. 같은 세포 유형의 세포가 함께 모이도록 하기 위해서는 서로 다른 조건에서 세포를 통합해야 합니다.
같은 세포 유형의 세포를 함께 모으는 것이 중요한 이유는 무엇입니까? < P > 모든 샘플/조건/패턴에서 우리는 세포 유형을 식별하고, 우리의 데이터인 이 세포 유형이 존재하며, 우리는 클러스터 간에 다르게 표현되는 유전자를 탐구해야 한다. 만약 우리가 한 클러스터에 우리의 대조 T 세포를 가지고 있고, 다른 클러스터에는 우리의 자극 T 세포가 있다면, 우리가 T 세포에서 풍부한 유전자를 찾으려고 할 때, 우리는 T 세포로 표시된 많은 유전자와 관련 유전자 처리와 통제의 차이를 돌려줄 것이다. 이것들은 구별하기 어려워 세포 유형 인식을 더욱 어렵게 할 수 있다. 만약 우리가 같은 클러스터에서 같은 세포 유형의 모든 세포를 가지고 있다면, 그것은 또한 보수적인 세포 유형을 식별하여 세포 유형 유전자가 클러스터 간에 다르게 표현되는 것을 식별할 수 있도록 도와준다. 또한 이러한 T 세포에 대한 다운스트림 분석 (예: 제어/치료 사이의 DE 분석, 리간드-수용체 분석 등) 을 수행하려면 동일한 세포 유형의 세포가 동일한 클러스터에 존재하는 것이 중요합니다. < P > 이 단원에서는 Seurat v3 안내 통합 자습서에서 개편된 다양한 조건 통합 샘플을 소개합니다. < P > 세포가 샘플, 조건, 배치, 데이터 세트, 패턴으로 클러스터링되는 경우 이 통합 단계를 통해 클러스터 및 다운스트림 분석을 크게 개선할 수 있습니다. < P > 통합을 위해 각 그룹 * * * 의 고도로 가변적인 유전자 (SCTransform 으로 식별됨) 를 사용한 다음' 통합' 또는' 조정' 하여 비슷한' * * * 생물학적 특성' 을 가진 세포나 그룹을 덮습니다. 예를 들어,
통합은 강력한 접근 방식입니다. 이러한 가장 큰 차이의 * * * 공유 리소스를 사용하여 조건이나 데이터 세트 간에 * * * * 이 공유하는 하위 집합 [Stuart, Bulter 등] 을 식별합니다. (218 년)]. 통합의 목표는 한 조건/데이터 세트의 세포 유형이 다른 조건/데이터 세트의 세포 유형과 일치하는지 확인하는 것입니다 (예: 자극된 대 식세포와 일치하는 대 식세포 제어). 。 < P > 구체적으로, 이 통합 방법은 그룹 내 적어도 하나의 세포 하위 집합 사이에' 대응' 또는 * * * * * 의 생물학적 상태를 기대합니다. 통합 분석 단계는 다음과 같습니다.
실행되는 다양한 분석 단계는 다음과 같습니다.
이제 SCTransform 객체를 입력으로 사용하여 조건 간 통합을 수행해 보겠습니다. < P > 우선, SCTransform 을 사용하여 인식할 수 있는 최대 돌연변이 유전자 3 개를 모두 통합해야 합니다. 기본적으로 이 함수는 처음 2, 개의 유전자만 선택합니다.
이제 통합을 위한 SCTransform 개체를 준비해야 합니다.
이제 CCA 를 실행하여 가장 좋은 파트너나 고정점을 찾아 잘못된 고정점을 필터링합니다. 데이터 세트의 경우 최대 15 분 정도 걸립니다. 또한 콘솔의 진행률 표시줄이 % 로 유지되지만 실제로 실행 중임을 알아야 합니다.
마지막으로 조건 간에 통합할 수 있습니다.
통합 후 통합된 데이터를 시각화하기 위해 PCA 및 umap (uniform manifold approximation and projection) 와 같은 차원 축소 기술을 사용할 수 있습니다. PCA 는 모든 PC 를 확인하지만 한 번에 두 개만 그릴 수 있습니다. 반면 UMAP 는 원하는 수의 주요 PC 에서 정보를 가져와 이 다차원 공간에 세포를 배열합니다. 다차원 공간에서 이러한 거리를 가져와 2 차원 공간에 그려 로컬 및 전역 구조를 유지합니다. 이런 식으로 세포 사이의 거리는 표현의 유사성을 나타낸다. UMAP 를 좀 더 자세히 살펴보고자 한다면, 이 문장 은 UMAP 이론에 대한 좋은 소개입니다.
이러한 시각화 결과를 생성하려면 먼저 PCA 및 UMAP 메서드를 실행해야 합니다. PCA 부터 시작해보죠. < P > PCA 매핑을 통해 PCA 가 이 두 조건을 잘 포괄하는 것을 볼 수 있습니다.
이제 UMAP 을 사용하여 시각화할 수 있습니다. 이 메소드를 실행하고 차트를 그립니다. < P > 때로는 conditions 간에 드로잉을 분할하면 모든 세포가 정렬되는지 쉽게 확인할 수 있습니다. DimPlot () 함수에 split.by 매개 변수를 추가하여 구현할 수 있습니다.
통합에는 시간이 걸릴 수 있으므로 통합 Seurat 객체를 저장하는 것이 좋습니다.