ساسافا

الميتابروتيوميات الميكروبية: من معالجة العينات وجمع البيانات إلى تحليل البيانات

وو انهوي، تشياو ليانغ*

قسم الكيمياء، جامعة فودان، شنغهاي 200433، الصين

 

 

 

ترتبط الكائنات الحية الدقيقة ارتباطًا وثيقًا بأمراض الإنسان وصحته. تعد كيفية فهم تكوين المجتمعات الميكروبية ووظائفها قضية رئيسية تحتاج إلى دراسة عاجلة. في السنوات الأخيرة، أصبحت الميتابروتيوميات وسيلة تقنية مهمة لدراسة تكوين ووظيفة الكائنات الحية الدقيقة. ومع ذلك، نظرًا للتعقيد وعدم التجانس العالي لعينات المجتمع الميكروبي، أصبحت معالجة العينات والحصول على بيانات قياس الطيف الكتلي وتحليل البيانات هي التحديات الرئيسية الثلاثة التي تواجهها حاليًا الميتابروتيوميات. في تحليل الميتابروتيوميكس، غالبًا ما يكون من الضروري تحسين المعالجة المسبقة لأنواع مختلفة من العينات واعتماد مخططات مختلفة للفصل الميكروبي والإثراء والاستخلاص والتحلل. على غرار بروتين نوع واحد، تتضمن أوضاع الحصول على بيانات قياس الطيف الكتلي في الميتابروتيوميات وضع الاكتساب المعتمد على البيانات (DDA) ووضع الاكتساب المعتمد على البيانات (DIA). يمكن لوضع الحصول على بيانات DIA جمع معلومات الببتيد الخاصة بالعينة بشكل كامل ولديه إمكانات تطوير كبيرة. ومع ذلك، نظرًا لتعقيد العينات الفوقية، أصبح تحليل بيانات DIA مشكلة كبيرة تعيق التغطية العميقة للبروتينات الفوقية. فيما يتعلق بتحليل البيانات، فإن الخطوة الأكثر أهمية هي بناء قاعدة بيانات تسلسل البروتين. إن حجم واكتمال قاعدة البيانات ليس لهما تأثير كبير على عدد عمليات التحديد فحسب، بل يؤثران أيضًا على التحليل على مستوى الأنواع والمستويات الوظيفية. في الوقت الحاضر، المعيار الذهبي لبناء قاعدة بيانات الميتابروتينوم هو قاعدة بيانات تسلسل البروتين المبنية على الميتاجينوم. وفي الوقت نفسه، ثبت أيضًا أن طريقة تصفية قاعدة البيانات العامة القائمة على البحث التكراري لها قيمة عملية قوية. من منظور استراتيجيات تحليل البيانات المحددة، احتلت أساليب تحليل بيانات DIA المتمركزة على الببتيد الاتجاه السائد المطلق. مع تطور التعلم العميق والذكاء الاصطناعي، سيتم تعزيز دقة وتغطية وسرعة تحليل تحليل البيانات البروتينية الكبيرة بشكل كبير. فيما يتعلق بتحليل المعلوماتية الحيوية النهائية، تم تطوير سلسلة من أدوات التعليقات التوضيحية في السنوات الأخيرة، والتي يمكنها إجراء تعليقات توضيحية للأنواع على مستوى البروتين ومستوى الببتيد ومستوى الجينات للحصول على تكوين المجتمعات الميكروبية. بالمقارنة مع طرق omics الأخرى، يعد التحليل الوظيفي للمجتمعات الميكروبية سمة فريدة من نوعها في علم البروتينات الكلية. أصبحت البروتينات الكلية جزءًا مهمًا من تحليل متعدد الأوميات للمجتمعات الميكروبية، ولا تزال تتمتع بإمكانات تطوير كبيرة من حيث عمق التغطية، وحساسية الكشف، واكتمال تحليل البيانات.

 

01 المعالجة المسبقة للعينات

في الوقت الحاضر، تُستخدم تكنولوجيا الميتابروتيوميات على نطاق واسع في أبحاث الميكروبيوم البشري والتربة والغذاء والمحيطات والحمأة النشطة وغيرها من المجالات. بالمقارنة مع تحليل البروتين من نوع واحد، تواجه المعالجة المسبقة للعينة من العينات المعقدة المزيد من التحديات. التركيب الميكروبي في العينات الفعلية معقد، والنطاق الديناميكي للوفرة كبير، وبنية جدار الخلية لأنواع مختلفة من الكائنات الحية الدقيقة مختلفة تمامًا، وغالبًا ما تحتوي العينات على كمية كبيرة من البروتينات المضيفة والشوائب الأخرى. لذلك، في تحليل metaproteome، غالبًا ما يكون من الضروري تحسين أنواع مختلفة من العينات واعتماد مخططات مختلفة للفصل الميكروبي والإثراء والاستخراج والتحلل.

إن استخراج البروتينات الميكروبية من عينات مختلفة له أوجه تشابه معينة بالإضافة إلى بعض الاختلافات، ولكن يوجد حاليًا نقص في عملية المعالجة المسبقة الموحدة لأنواع مختلفة من عينات الميتابروتينوم.

 

02 الحصول على بيانات قياس الطيف الكتلي

في تحليل بروتينات البندقية، يتم أولاً فصل خليط الببتيد بعد المعالجة المسبقة في العمود الكروماتوغرافي، ثم يدخل في مطياف الكتلة للحصول على البيانات بعد التأين. على غرار تحليل البروتينات من نوع واحد، تتضمن أوضاع الحصول على بيانات قياس الطيف الكتلي في تحليل البروتينات الكبيرة وضع DDA ووضع DIA.

 

مع التكرار والتحديث المستمر لأدوات قياس الطيف الكتلي، يتم تطبيق أدوات قياس الطيف الكتلي ذات الحساسية والدقة الأعلى على البروتين الميتابروتيوم، كما يتم أيضًا تحسين عمق التغطية لتحليل الميتابروتيوم بشكل مستمر. لفترة طويلة، تم استخدام سلسلة من أدوات قياس الطيف الكتلي عالية الدقة برئاسة Orbitrap على نطاق واسع في الميتابروتيوم.

 

يوضح الجدول 1 من النص الأصلي بعض الدراسات التمثيلية حول الميتابروتيوميات من عام 2011 إلى الوقت الحاضر من حيث نوع العينة، واستراتيجية التحليل، وأداة قياس الطيف الكتلي، وطريقة الاستحواذ، وبرامج التحليل، وعدد التعريفات.

 

03تحليل بيانات قياس الطيف الكتلي

3.1 استراتيجية تحليل بيانات DDA

3.1.1 البحث في قاعدة البيانات

3.1.2جديداستراتيجية التسلسل

3.2 استراتيجية تحليل بيانات مطار الدوحة الدولي

 

04تصنيف الأنواع والشرح الوظيفي

يعد تكوين المجتمعات الميكروبية على مستويات تصنيفية مختلفة أحد مجالات البحث الرئيسية في أبحاث الميكروبيوم. في السنوات الأخيرة، تم تطوير سلسلة من أدوات التعليقات التوضيحية لتعليق الأنواع على مستوى البروتين ومستوى الببتيد ومستوى الجينات للحصول على تكوين المجتمعات الميكروبية.

 

جوهر الشرح الوظيفي هو مقارنة تسلسل البروتين المستهدف مع قاعدة بيانات تسلسل البروتين الوظيفي. باستخدام قواعد بيانات وظائف الجينات مثل GO، وCOG، وKEGG، وeggNOG، وما إلى ذلك، يمكن إجراء تحليلات توضيحية وظيفية مختلفة على البروتينات التي تم تحديدها بواسطة البروتينات الكبيرة. تتضمن أدوات التعليقات التوضيحية Blast2GO وDAVID وKOBAS وما إلى ذلك.

 

05 ملخص وتوقعات

تلعب الكائنات الحية الدقيقة دورًا مهمًا في صحة الإنسان وأمراضه. في السنوات الأخيرة، أصبحت الميتابروتيوميات وسيلة تقنية مهمة لدراسة وظيفة المجتمعات الميكروبية. تشبه العملية التحليلية لعلم الميتابروتيوميات تلك الخاصة بالبروتينات أحادية النوع، ولكن نظرًا لتعقيد موضوع البحث في علم الميتابروتيوميات، يجب اعتماد استراتيجيات بحث محددة في كل خطوة تحليل، بدءًا من المعالجة المسبقة للعينات، والحصول على البيانات وحتى تحليل البيانات. في الوقت الحاضر، بفضل تحسين طرق المعالجة المسبقة، والابتكار المستمر لتكنولوجيا قياس الطيف الكتلي والتطور السريع للمعلوماتية الحيوية، حققت الميتابروتيوميات تقدمًا كبيرًا في عمق التحديد ونطاق التطبيق.

 

في عملية المعالجة المسبقة لعينات البروتينات الكبيرة، يجب مراعاة طبيعة العينة أولاً. تعد كيفية فصل الكائنات الحية الدقيقة عن الخلايا والبروتينات البيئية أحد التحديات الرئيسية التي تواجه البروتينات الكبيرة، ويعد التوازن بين كفاءة الفصل وفقدان الميكروبات مشكلة ملحة يجب حلها. ثانيا، استخراج البروتين من الكائنات الحية الدقيقة يجب أن يأخذ في الاعتبار الاختلافات الناجمة عن عدم التجانس الهيكلي للبكتيريا المختلفة. تتطلب عينات البروتينات الكبيرة في نطاق التتبع أيضًا طرقًا محددة للمعالجة المسبقة.

 

فيما يتعلق بأدوات قياس الطيف الكتلي، شهدت أدوات قياس الطيف الكتلي السائدة تحولًا من أجهزة قياس الطيف الكتلي المعتمدة على محللات الكتلة Orbitrap مثل LTQ-Orbitrap وQ Exactive إلى أجهزة قياس الطيف الكتلي المعتمدة على الحركة الأيونية المقترنة بمحللات الكتلة وقت الرحلة مثل timsTOF Pro . تتمتع سلسلة أدوات timsTOF التي تحتوي على معلومات أبعاد التنقل الأيوني بدقة كشف عالية وحد اكتشاف منخفض وقابلية تكرار جيدة. لقد أصبحت تدريجيًا أدوات مهمة في مجموعة متنوعة من مجالات البحث التي تتطلب الكشف عن قياس الطيف الكتلي، مثل البروتين، والبروتين الفوقي، والأيض لنوع واحد. تجدر الإشارة إلى أنه لفترة طويلة، أدى النطاق الديناميكي لأدوات قياس الطيف الكتلي إلى الحد من عمق تغطية البروتين في أبحاث البروتين الفوقي. في المستقبل، يمكن لأدوات قياس الطيف الكتلي ذات النطاق الديناميكي الأكبر تحسين حساسية ودقة تحديد البروتين في البروتينات.

 

للحصول على بيانات قياس الطيف الكتلي، على الرغم من أن وضع الحصول على بيانات DIA قد تم اعتماده على نطاق واسع في بروتين نوع واحد، فإن معظم تحليلات البروتين الكلي الحالية لا تزال تستخدم وضع الحصول على بيانات DDA. يمكن لوضع الحصول على بيانات DIA الحصول بشكل كامل على معلومات أيون الجزء من العينة، وبالمقارنة مع وضع الحصول على بيانات DDA، فإنه لديه القدرة على الحصول بشكل كامل على معلومات الببتيد لعينة البروتين الكبير. ومع ذلك، نظرًا للتعقيد الكبير لبيانات DIA، لا يزال تحليل بيانات البروتين الكلي لـ DIA يواجه صعوبات كبيرة. من المتوقع أن يؤدي تطوير الذكاء الاصطناعي والتعلم العميق إلى تحسين دقة واكتمال تحليل بيانات DIA.

 

في تحليل بيانات الميتابروتيوميات، إحدى الخطوات الرئيسية هي بناء قاعدة بيانات تسلسل البروتين. بالنسبة لمجالات البحث الشائعة مثل النباتات المعوية، يمكن استخدام قواعد البيانات الميكروبية المعوية مثل IGC وHMP، وقد تم تحقيق نتائج تحديد جيدة. بالنسبة لمعظم تحليلات الميتابروتيوميات الأخرى، لا تزال استراتيجية بناء قاعدة البيانات الأكثر فعالية هي إنشاء قاعدة بيانات تسلسل البروتين الخاصة بالعينة بناءً على بيانات التسلسل الميتاجينومي. بالنسبة لعينات المجتمع الميكروبي ذات التعقيد العالي والنطاق الديناميكي الكبير، من الضروري زيادة عمق التسلسل لزيادة تحديد الأنواع منخفضة الوفرة، وبالتالي تحسين تغطية قاعدة بيانات تسلسل البروتين. عند عدم وجود بيانات تسلسلية، يمكن استخدام طريقة بحث تكرارية لتحسين قاعدة البيانات العامة. ومع ذلك، قد يؤثر البحث التكراري على مراقبة جودة FDR، لذا يجب فحص نتائج البحث بعناية. وبالإضافة إلى ذلك، فإن إمكانية تطبيق نماذج مراقبة الجودة التقليدية لـ FDR في تحليل الميتابروتيوميات لا تزال تستحق الاستكشاف. فيما يتعلق باستراتيجية البحث، يمكن لاستراتيجية المكتبة الطيفية الهجينة تحسين عمق التغطية للبروتينات الفوقية DIA. في السنوات الأخيرة، أظهرت المكتبة الطيفية المتوقعة التي تم إنشاؤها بناءً على التعلم العميق أداءً فائقًا في بروتينات DIA. ومع ذلك، غالبًا ما تحتوي قواعد البيانات البروتينية الفوقية على ملايين من إدخالات البروتين، مما يؤدي إلى نطاق واسع من المكتبات الطيفية المتوقعة، ويستهلك الكثير من موارد الحوسبة، ويؤدي إلى مساحة بحث كبيرة. بالإضافة إلى ذلك، فإن التشابه بين تسلسلات البروتين في الميتابروتيوم يختلف بشكل كبير، مما يجعل من الصعب ضمان دقة نموذج تنبؤ المكتبة الطيفية، لذلك لم يتم استخدام المكتبات الطيفية المتوقعة على نطاق واسع في الميتبروتيوميات. بالإضافة إلى ذلك، هناك حاجة إلى تطوير استراتيجيات جديدة لاستدلال البروتين وتصنيفه لتطبيقها على تحليل الميتابروتيوميات للبروتينات شديدة التشابه في التسلسل.

 

باختصار، باعتبارها تكنولوجيا بحثية ناشئة للميكروبيوم، حققت تكنولوجيا الميتابروتيوميات نتائج بحثية مهمة ولديها أيضًا إمكانات تطوير هائلة.


وقت النشر: 30 أغسطس 2024