تحليل شبكات الارتباط المرجح

تحليل شبكات الارتباط المرجح إنگليزية: Weighted correlation network analysis، يُعرف أيضاً باسم تحليل شبكة التعبير المشترك للجين الموزون (WGCNA)، وهو طريقة التنقيب في البيانات المستخدمة على نطاق واسع خاصة لدراسة الشبكات الحيوية بناء على الارتباطات الزوجية بين المتغيرات. بينما يمكن تطبيقه على معظم مجموعات البيانات عالية الأبعاد، فقد تم استخدامه على نطاق واسع في تطبيقات الجينوم. يسمح للمرء بتحديد الوحدات (المجموعات)، والمحاور داخل الوحدات، وعقد الشبكة فيما يتعلق بعضوية الوحدة، ودراسة العلاقات بين وحدات التعبير المشترك، ومقارنة طوبولوجيا الشبكة للشبكات المختلفة (تحليل الشبكة التفاضلي). يمكن استخدام WGCNA باعتباره تقنية تقليل البيانات (المرتبط بالتحليل العاملي)، كطريقة التحليل العنقودي (التعنقد الضبابي)، كميزة طريقة الاختيار (مثل طريقة فحص الجينات)، كإطار عمل لدمج البيانات التكميلية (الجينية) (بناءً على الارتباطات المرجحة بين المتغيرات الكمية)، وكأسلوب البيانات الاستكشافية.[1] على الرغم من أن WGCNA يدمج تقنيات استكشاف البيانات التقليدية، فإن لغة الشبكة البديهية وإطار التحليل الخاص به يتجاوز أي أسلوب تحليل قياسي. نظراً لأنه يستخدم منهجية الشبكة ومناسب تماماً لدمج مجموعات البيانات الجينومية التكميلية، يمكن تفسيره على أنه نظم حيوية أو طريقة تحليل البيانات الجينية للأنظمة. من خلال اختيار المحاور داخل الوحدات في وحدات الإجماع، تؤدي WGCNA أيضاً إلى ظهور تقنيات التحليل التلوي المستندة إلى الشبكة.[2]

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

تاريخ

طوِّرت طريقة WGCNA بواسطة ستيڤ هورڤات، أستاذ علم الوراثة البشري في كلية ديڤد گفن للطب في جامعة كاليفورنيا، لوس أنجلس و[[إحصاء حيوي |الإحصاء الحيوي]] في UCLA فيلدنگ كلية الصحة العامة وزملاؤه في جامعة كاليفورنيا، وأعضاء المختبر (السابقين) (ولا سيما پيتر لانگفلدر، وبن تشانگ، وجون دونگ). فقد نشأ الكثير من العمل من التعاون مع الباحثين التطبيقيين. على وجه الخصوص، تم تطوير شبكات الارتباط المرجحة في مناقشات مشتركة مع باحثي السرطان پول ميشيل، وستانلي إف نلسون، وعلماء الأعصاب دانيال گشوند، ومايكل سي أولدهام (وفقاً لقسم الإقرار في[1]). وتوجد مؤلفات كثيرة حول شبكات التبعية والشبكات الخالية من المقاييس وشبكات التعايش.[بحاجة لمصدر]


مقارنة بين شبكات الارتباط المرجح وغير المرجح

يمكن تفسير شبكة الارتباط المرجحة على أنها حالة خاصة من الشبكة المرجحة أو شبكة التبعية أو شبكة الارتباط. يمكن أن يكون تحليل شبكة الارتباط المرجح جذاباً للأسباب التالية:

  • يحافظ بناء الشبكة (على أساس العتبة المعتدلة لمعامل الارتباط) على الطبيعة المستمرة لمعلومات الارتباط الأساسية. على سبيل المثال، شبكات الارتباط المرجح التي يتم إنشاؤها على أساس الارتباطات بين المتغيرات الرقمية لا تتطلب اختيار عتبة صلبة. قد تؤدي تجزئة المعلومات وووضع حد العتبة-(الثابتة) إلى فقدان المعلومات.[3]
  • يعطي بناء الشبكة نتائج قوية للغاية فيما يتعلق بالخيارات المختلفة للعتبة المعتدلة.[3]في المقابل، غالباً ما تعتمد النتائج المستندة إلى الشبكات غير المرجحة، التي تم إنشاؤها عن طريق تحديد مقياس الارتباط الزوجي، بشدة على العتبة.
  • تسهل شبكات الارتباط المرجح التفسير الهندسي بناءً على التفسير الزاوي للارتباط، الفصل 6 في.[4]
  • يمكن استخدام إحصائيات الشبكة الناتجة لتحسين أساليب التنقيب عن البيانات القياسية مثل تحليل الكتلة حيث يمكن في كثير من الأحيان تحويل مقاييس التشابه (dis) إلى شبكات مرجحة;[5]انظر القسم 6 في.[4]
  • يوفر WGCNA إحصائيات قوية للحفاظ على الوحدة والتي يمكن استخدامها لتحديد التشابه مع حالة أخرى. كما تسمح إحصائيات الحفاظ على الوحدات النمطية بدراسة الاختلافات بين البنية المعيارية للشبكات.[6]
  • غالبًا ما يمكن تقريب الشبكات المرجحة وشبكات الارتباط بواسطة شبكات "قابلة للتحليل".[4][7] غالباً ما يكون من الصعب تحقيق مثل هذه التقريبات للشبكات المتناثرة غير الموزونة. لذلك، تسمح الشبكات المرجحة (الارتباط) بمحدودية شحيحة (من حيث الوحدات النمطية وعضوية الوحدة) (الفصول 2، 6 في [1]) و.[8]

المنهج

أولاً، يُعرّف المرء مقياس تشابه التعبير الجيني المشترك الذي يستخدم لتعريف الشبكة. نشير إلى مقياس تشابه التعبير الجيني المشترك لزوج من الجينات i وj بواسطة . تستخدم العديد من دراسات التعبير المشترك القيمة المطلقة للارتباط كمقياس تشابه غير موقعة للتعبير المشترك،

حيث تتكون ملفات تعريف التعبير الجيني و من التعبير عن الجينات i وj عبر عينات متعددة. ومع ذلك، قد يؤدي استخدام القيمة المطلقة للارتباط إلى تشويش المعلومات المرتبطة حيوياً، حيث لا يتم التمييز بين قمع الجينات والتفعيل. في المقابل، في الشبكات الموقعة، يعكس التشابه بين الجينات علامة الارتباط بين ملفات تعريف التعبير الخاصة بهم. لتحديد مقياس تعبير مشترك موقّع بين ملفات تعريف التعبير الجيني و، يمكن للمرء استخدام تحويل بسيط للارتباط:

كإجراء غير موقع ، يأخذ التشابه الموقع قيمة بين 0 و1. نلاحظ أن التشابه غير الموضح بين جينين معبر عنه بشكل معاكس () يساوي 1 بينما يساوي 0 للتشابه الموقع. وبالمثل، في حين أن مقياس التعبير المشترك غير الموقعة لجينين مع ارتباط صفري يظل صفراً، فإن التشابه الموقع يساوي 0.5.

بعد ذلك، تُستخدم مصفوفة مجاورة (شبكة)، ، لتحديد مدى قوة اتصال الجينات ببعضها البعض. يتم تعريف من خلال تحديد مصفوفة تشابه التعبير المشترك . تنتج العتبة "الصلبة" (التقسيم الثنائي) عن مقياس التشابه شبكة تعبير مشترك جيني غير مرجح. يُحدد تقارب الشبكة غير المرجح على وجه التحديد ليكون 1 إذا كان و0 بخلاف ذلك. نظراً لأن العتبة الصلبة تشفر اتصالات الجينات بطريقة ثنائية، فقد تكون حساسة لاختيار الحد وتؤدي إلى فقدان معلومات التعبير المشترك.[3] يمكن الحفاظ على الطبيعة المستمرة لمعلومات التعبير المشترك من خلال استخدام عتبة ناعمة، مما ينتج عنه شبكة مرجحة. على وجه التحديد، يستخدم WGCNA دالة الطاقة التالية لتقييم قوة الاتصال الخاصة بهم:

,

حيث القوة هي پارامتر العتبة الناعمة. تُستخدم القيم الافتراضية and للشبكات غير الموقعة والموقعة على التوالي. بدلاً من ذلك، يمكن اختيار باستخدام معيار طوبولوجيا خالي من المقياس الذي يرقى إلى اختيار أصغر قيمة لـ بحيث يتم الوصول إلى طوبولوجيا خالية من المقياس التقريبي.[3]

نظراً لأن ، فإن تجاور الشبكة المرجحة مرتبط خطياً بتشابه التعبير المشترك على مقياس لوغاريتمي. لاحظ أن القوة العالية تحول أوجه التشابه العالية إلى تقاربات عالية، بينما تدفع أوجه التشابه المنخفضة نحو الصفر. نظراً لأن إجراء العتبة الناعمة المطبق على مصفوفة الارتباط الزوجي يؤدي إلى مصفوفة تجاور مرجحة، فإن التحليل التالي هو يشار إليه على أنه تحليل شبكة التعبير المشترك للجينات المرجحة.

تتمثل إحدى الخطوات الرئيسية في التحليل المركزي للوحدة في تجميع الجينات في وحدات شبكة باستخدام مقياس القرب من الشبكة. بشكل تقريبي، يكون لزوج من الجينات تقارب كبير إذا كان مترابطاً بشكل وثيق. حسب الاصطلاح، فإن القرب الأقصى بين جينين هو 1 والحد الأدنى للقرب هو 0. عادةً، يستخدم WGCNA مقياس التداخل الطوبولوجي (TOM) باعتباره تقارباً.[9][10] والتي يمكن تعريفها أيضاً للشبكات المرجحة.[3] يجمع TOM بين جوار اثنين من الجينات وقوة الاتصال التي يتشاركها هذان الجينان مع جينات "الطرف الثالث" الأخرى. يعد TOM مقياساً قوياً للغاية لترابط الشبكة (القرب). يُستخدم هذا التقارب كمدخل لمتوسط التجميع الهرمي للرابط. يتم تعريف الوحدات النمطية على أنها فروع لشجرة الكتلة الناتجة باستخدام نهج القطع الفرعي الديناميكي.[11] بعد ذلك، يتم تلخيص الجينات الموجودة داخل وحدة نمطية معينة بالوحدة eigengene، والتي يمكن اعتبارها أفضل ملخص لبيانات تعبير الوحدة النمطية.[4] يتم تعريف eigengene الوحدة النمطية لوحدة نمطية معينة على أنها المكون الرئيسي الأول لملفات تعريف التعبير الموحدة. تحدد Eigengenes المؤشرات الحيوية القوية،[12]ويمكن استخدامها كميزات في نماذج التعلم الآلي المعقدة مثل الشبكات البايزي.[13]للعثور على وحدات تتعلق بسمة سريرية ذات أهمية، ترتبط وحدات eigengenes بالسمة السريرية ذات الأهمية، مما يؤدي إلى قياس أهمية eigengene. يمكن استخدام Eigengenes كميزات في نماذج تنبؤية أكثر تعقيداً بما في ذلك أشجار القرار والشبكات البايزية.[12] يمكن للمرء أيضاً إنشاء شبكات تعبير مشترك بين وحدات eigengenes (شبكات eigengene)، أي الشبكات التي تكون عقدها وحدات نمطية.[14] لتحديد جينات المحور داخل الوحدة داخل وحدة معينة، يمكن للمرء استخدام نوعين من تدابير الاتصال. الأول، المشار إليه باسم، يتم تعريفه على أساس ربط كل جين بوحدة eigengene ذات الصلة. الثانية، يشار إليها باسم kIN، يتم تعريفها على أنها مجموع أوجه التقارب فيما يتعلق بجينات الوحدة. في الممارسة العملية، هذين المقياسين متكافئان.[4] لاختبار ما إذا كانت الوحدة النمطية محفوظة في مجموعة بيانات أخرى، يمكن للمرء استخدام إحصائيات الشبكة المختلفة، على سبيل المثال .[6]

التطبيقات

تم استخدام WGCNA على نطاق واسع لتحليل بيانات التعبير الجيني (أي بيانات النسخ)، على سبيل المثال للعثور على جينات المحور الوراثي.[2][15]على سبيل المثال، كشفت دراسة WGCNA أن عوامل النسخ الجديدة مرتبطة بالاستجابة للجرعة من بيسفول إيه (BPA).[16]

غالباً ما يُستخدم كخطوة لتقليل البيانات في التطبيقات الجينية للأنظمة حيث يتم تمثيل الوحدات بواسطة "وحدات eigengenes" على سبيل المثال.[17][18] يمكن استخدام وحدات eigengenes لربط الوحدات بالسمات السريرية. شبكات Eigengene هي شبكات تعاونية بين وحدات eigengenes (أي الشبكات التي تكون عقدها وحدات نمطية). يستخدم WGCNA على نطاق واسع في تطبيقات علم الأعصاب، على سبيل المثال.[19][20] ولتحليل البيانات الجينومية بما في ذلك بيانات المصفوفة الدقيقة،[21]بيانات تسلسل الحمض النووي الريبي أحادية الخلية[22][23] بيانات مثيلة الحمض النووي،[24]بيانات miRNA ، وتعداد الببتيد[25] و الكائنات الدقيقة (تسلسل الجينات الرنا الريباسي 16S).[26] تشمل التطبيقات الأخرى بيانات تصوير الدماغ، على سبيل المثال بيانات التصوير بالرنين المغناطيسي الوظيفي.[27]

حزمة برامج R

توفر WGCNA حزمة برامج آر[28] دوال لتنفيذ جميع جوانب تحليل الشبكة المرجحة (بناء الوحدة، واختيار الجينات المحورية، وإحصاءات الحفاظ على الوحدة، والتحليل التفاضلي للشبكة، وإحصاءات الشبكة). تتوفر حزمة WGCNA من شبكة الأرشيف الشاملة آر (CRAN)، المستودع القياسي لحزم آر الإضافية.

المراجع

  1. ^ أ ب ت Horvath S (2011). Weighted Network Analysis: Application in Genomics and Systems Biology. New York, NY: Springer. ISBN 978-1-4419-8818-8.
  2. ^ أ ب Langfelder P, Mischel PS, Horvath S, Ravasi T (17 April 2013). "When Is Hub Gene Selection Better than Standard Meta-Analysis?". PLOS ONE. 8 (4): e61505. Bibcode:2013PLoSO...861505L. doi:10.1371/journal.pone.0061505. PMC 3629234. PMID 23613865.
  3. ^ أ ب ت ث ج Zhang B, Horvath S (2005). "A general framework for weighted gene co-expression network analysis" (PDF). Statistical Applications in Genetics and Molecular Biology. 4: 17. CiteSeerX 10.1.1.471.9599. doi:10.2202/1544-6115.1128. PMID 16646834. S2CID 7756201.
  4. ^ أ ب ت ث ج Horvath S, Dong J (2008). "Geometric Interpretation of Gene Coexpression Network Analysis". PLOS Computational Biology. 4 (8): e1000117. Bibcode:2008PLSCB...4E0117H. doi:10.1371/journal.pcbi.1000117. PMC 2446438. PMID 18704157.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  5. ^ Oldham MC, Langfelder P, Horvath S (12 June 2012). "Network methods for describing sample relationships in genomic datasets: application to Huntington's disease". BMC Systems Biology. 6: 63. doi:10.1186/1752-0509-6-63. PMC 3441531. PMID 22691535.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  6. ^ أ ب Langfelder P, Luo R, Oldham MC, Horvath S (20 January 2011). "Is my network module preserved and reproducible?". PLOS Computational Biology. 7 (1): e1001057. Bibcode:2011PLSCB...7E1057L. doi:10.1371/journal.pcbi.1001057. PMC 3024255. PMID 21283776.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  7. ^ Dong J, Horvath S (4 June 2007). "Understanding network concepts in modules". BMC Systems Biology. 1: 24. doi:10.1186/1752-0509-1-24. PMC 3238286. PMID 17547772.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  8. ^ Ranola JM, Langfelder P, Lange K, Horvath S (14 March 2013). "Cluster and propensity based approximation of a network". BMC Systems Biology. 7: 21. doi:10.1186/1752-0509-7-21. PMC 3663730. PMID 23497424.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  9. ^ Ravasz E, Somera AL, Mongru DA, Oltvai ZN, Barabasi AL (2002). "Hierarchical organization of modularity in metabolic networks". Science. 297 (5586): 1551–1555. arXiv:cond-mat/0209244. Bibcode:2002Sci...297.1551R. doi:10.1126/science.1073374. PMID 12202830. S2CID 14452443.
  10. ^ Yip AM, Horvath S (24 January 2007). "Gene network interconnectedness and the generalized topological overlap measure". BMC Bioinformatics. 8: 22. doi:10.1186/1471-2105-8-22. PMC 1797055. PMID 17250769.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  11. ^ Langfelder P, Zhang B, Horvath S (2007). "Defining clusters from a hierarchical cluster tree: the Dynamic Tree Cut library for R". Bioinformatics. 24 (5): 719–20. doi:10.1093/bioinformatics/btm563. PMID 18024473. S2CID 1095190.
  12. ^ أ ب Foroushani A, Agrahari R, Docking R, Chang L, Duns G, Hudoba M, Karsan A, Zare H (16 March 2017). "Large-scale gene network analysis reveals the significance of extracellular matrix pathway and homeobox genes in acute myeloid leukemia: an introduction to the Pigengene package and its applications". BMC Medical Genomics. 10 (1): 16. doi:10.1186/s12920-017-0253-6. PMC 5353782. PMID 28298217.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  13. ^ Agrahari, Rupesh; Foroushani, Amir; Docking, T. Roderick; Chang, Linda; Duns, Gerben; Hudoba, Monika; Karsan, Aly; Zare, Habil (3 May 2018). "Applications of Bayesian network models in predicting types of hematological malignancies". Scientific Reports (in الإنجليزية). 8 (1): 6951. Bibcode:2018NatSR...8.6951A. doi:10.1038/s41598-018-24758-5. ISSN 2045-2322. PMC 5934387. PMID 29725024.
  14. ^ Langfelder P, Horvath S (2007). "Eigengene networks for studying the relationships between co-expression modules". BMC Systems Biology. 2007 (1): 54. doi:10.1186/1752-0509-1-54. PMC 2267703. PMID 18031580.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  15. ^ Horvath S, Zhang B, Carlson M, Lu KV, Zhu S, Felciano RM, Laurance MF, Zhao W, Shu Q, Lee Y, Scheck AC, Liau LM, Wu H, Geschwind DH, Febbo PG, Kornblum HI, Cloughesy TF, Nelson SF, Mischel PS (2006). "Analysis of Oncogenic Signaling Networks in Glioblastoma Identifies ASPM as a Novel Molecular Target". PNAS. 103 (46): 17402–17407. Bibcode:2006PNAS..10317402H. doi:10.1073/pnas.0608396103. PMC 1635024. PMID 17090670.
  16. ^ Hartung, Thomas; Kleensang, Andre; Tran, Vy; Maertens, Alexandra (2018). "Weighted Gene Correlation Network Analysis (WGCNA) Reveals Novel Transcription Factors Associated With Bisphenol A Dose-Response". Frontiers in Genetics (in English). 9: 508. doi:10.3389/fgene.2018.00508. ISSN 1664-8021. PMC 6240694. PMID 30483308.{{cite journal}}: CS1 maint: unrecognized language (link)
  17. ^ Chen Y, Zhu J, Lum PY, Yang X, Pinto S, MacNeil DJ, Zhang C, Lamb J, Edwards S, Sieberts SK, Leonardson A, Castellini LW, Wang S, Champy MF, Zhang B, Emilsson V, Doss S, Ghazalpour A, Horvath S, Drake TA, Lusis AJ, Schadt EE (27 March 2008). "Variations in DNA elucidate molecular networks that cause disease". Nature. 452 (7186): 429–35. Bibcode:2008Natur.452..429C. doi:10.1038/nature06757. PMC 2841398. PMID 18344982.
  18. ^ Plaisier CL, Horvath S, Huertas-Vazquez A, Cruz-Bautista I, Herrera MF, Tusie-Luna T, Aguilar-Salinas C, Pajukanta P, Storey JD (11 September 2009). "A Systems Genetics Approach Implicates USF1, FADS3, and Other Causal Candidate Genes for Familial Combined Hyperlipidemia". PLOS Genetics. 5 (9): e1000642. doi:10.1371/journal.pgen.1000642. PMC 2730565. PMID 19750004.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  19. ^ Voineagu I, Wang X, Johnston P, Lowe JK, Tian Y, Horvath S, Mill J, Cantor RM, Blencowe BJ, Geschwind DH (25 May 2011). "Transcriptomic analysis of autistic brain reveals convergent molecular pathology". Nature. 474 (7351): 380–4. doi:10.1038/nature10110. PMC 3607626. PMID 21614001.
  20. ^ Hawrylycz MJ, Lein ES, Guillozet-Bongaarts AL, Shen EH, Ng L, Miller JA, van de Lagemaat LN, Smith KA, Ebbert A, Riley ZL, Abajian C, Beckmann CF, Bernard A, Bertagnolli D, Boe AF, Cartagena PM, Chakravarty MM, Chapin M, Chong J, Dalley RA, David Daly B, Dang C, Datta S, Dee N, Dolbeare TA, Faber V, Feng D, Fowler DR, Goldy J, Gregor BW, Haradon Z, Haynor DR, Hohmann JG, Horvath S, Howard RE, Jeromin A, Jochim JM, Kinnunen M, Lau C, Lazarz ET, Lee C, Lemon TA, Li L, Li Y, Morris JA, Overly CC, Parker PD, Parry SE, Reding M, Royall JJ, Schulkin J, Sequeira PA, Slaughterbeck CR, Smith SC, Sodt AJ, Sunkin SM, Swanson BE, Vawter MP, Williams D, Wohnoutka P, Zielke HR, Geschwind DH, Hof PR, Smith SM, Koch C, Grant S, Jones AR (20 September 2012). "An anatomically comprehensive atlas of the adult human brain transcriptome". Nature. 489 (7416): 391–399. Bibcode:2012Natur.489..391H. doi:10.1038/nature11405. PMC 4243026. PMID 22996553.
  21. ^ Kadarmideen HN, Watson-Haigh NS, Andronicos NM (2011). "Systems biology of ovine intestinal parasite resistance: disease gene modules and biomarkers". Molecular BioSystems. 7 (1): 235–246. doi:10.1039/C0MB00190B. PMID 21072409.
  22. ^ Kogelman LJ, Cirera S, Zhernakova DV, Fredholm M, Franke L, Kadarmideen HN (30 September 2014). "Identification of co-expression gene networks, regulatory genes and pathways for obesity based on adipose tissue RNA Sequencing in a porcine model". BMC Medical Genomics. 7 (1): 57. doi:10.1186/1755-8794-7-57. PMC 4183073. PMID 25270054.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  23. ^ Xue Z, Huang K, Cai C, Cai L, Jiang CY, Feng Y, Liu Z, Zeng Q, Cheng L, Sun YE, Liu JY, Horvath S, Fan G (29 August 2013). "Genetic programs in human and mouse early embryos revealed by single-cell RNA sequencing". Nature. 500 (7464): 593–7. Bibcode:2013Natur.500..593X. doi:10.1038/nature12364. PMC 4950944. PMID 23892778.
  24. ^ Horvath S, Zhang Y, Langfelder P, Kahn RS, Boks MP, van Eijk K, van den Berg LH, Ophoff RA (3 October 2012). "Aging effects on DNA methylation modules in human brain and blood tissue". Genome Biology. 13 (10): R97. doi:10.1186/gb-2012-13-10-r97. PMC 4053733. PMID 23034122.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  25. ^ Shirasaki DI, Greiner ER, Al-Ramahi I, Gray M, Boontheung P, Geschwind DH, Botas J, Coppola G, Horvath S, Loo JA, Yang XW (12 July 2012). "Network organization of the huntingtin proteomic interactome in mammalian brain". Neuron. 75 (1): 41–57. doi:10.1016/j.neuron.2012.05.024. PMC 3432264. PMID 22794259.
  26. ^ No label or title -- debug: Q21559533, Wikidata Q21559533 
  27. ^ Mumford JA, Horvath S, Oldham MC, Langfelder P, Geschwind DH, Poldrack RA (1 October 2010). "Detecting network modules in fMRI time series: a weighted network analysis approach". NeuroImage. 52 (4): 1465–76. doi:10.1016/j.neuroimage.2010.05.047. PMC 3632300. PMID 20553896.
  28. ^ Langfelder P, Horvath S (29 December 2008). "WGCNA: an R package for weighted correlation network analysis". BMC Bioinformatics. 9: 559. doi:10.1186/1471-2105-9-559. PMC 2631488. PMID 19114008.{{cite journal}}: CS1 maint: unflagged free DOI (link)