სასავა

მიკრობული მეტაპროტეომიკა: ნიმუშის დამუშავებიდან, მონაცემთა შეგროვებიდან მონაცემთა ანალიზამდე

ვუ ენჰუი, კიაო ლიანგი*

ქიმიის დეპარტამენტი, ფუდანის უნივერსიტეტი, შანხაი 200433, ჩინეთი

 

 

 

მიკროორგანიზმები მჭიდრო კავშირშია ადამიანის დაავადებებთან და ჯანმრთელობასთან. როგორ გავიგოთ მიკრობული თემების შემადგენლობა და მათი ფუნქციები, ეს არის მთავარი საკითხი, რომელიც სასწრაფოდ შესწავლას საჭიროებს. ბოლო წლებში მეტაპროტეომიკა გახდა მნიშვნელოვანი ტექნიკური საშუალება მიკროორგანიზმების შემადგენლობისა და ფუნქციის შესასწავლად. თუმცა, მიკრობული საზოგადოების ნიმუშების სირთულისა და მაღალი ჰეტეროგენურობის გამო, ნიმუშის დამუშავება, მასობრივი სპექტრომეტრიის მონაცემების მოპოვება და მონაცემთა ანალიზი გახდა სამი ძირითადი გამოწვევა, რომელსაც ამჟამად აწყდება მეტაპროტეომიკა. მეტაპროტეომიკის ანალიზში ხშირად საჭიროა სხვადასხვა ტიპის ნიმუშების წინასწარი დამუშავების ოპტიმიზაცია და მიკრობული გამოყოფის, გამდიდრების, ექსტრაქციისა და ლიზისის სხვადასხვა სქემები. ერთი სახეობის პროტეომის მსგავსად, მასობრივი სპექტრომეტრიის მონაცემთა შეძენის რეჟიმები მეტაპროტეომიკაში მოიცავს მონაცემებზე დამოკიდებულ შეძენის (DDA) რეჟიმს და მონაცემთა დამოუკიდებელ შეძენის (DIA) რეჟიმს. DIA მონაცემთა შეძენის რეჟიმს შეუძლია მთლიანად შეაგროვოს ნიმუშის პეპტიდური ინფორმაცია და აქვს განვითარების დიდი პოტენციალი. თუმცა, მეტაპროტეომის ნიმუშების სირთულის გამო, მისი DIA მონაცემთა ანალიზი გახდა მთავარი პრობლემა, რომელიც აფერხებს მეტაპროტეომიკის ღრმა გაშუქებას. მონაცემთა ანალიზის თვალსაზრისით, ყველაზე მნიშვნელოვანი ნაბიჯი არის ცილის თანმიმდევრობის მონაცემთა ბაზის აგება. მონაცემთა ბაზის ზომა და სისრულე არა მხოლოდ დიდ გავლენას ახდენს იდენტიფიკაციის რაოდენობაზე, არამედ გავლენას ახდენს ანალიზზე სახეობებსა და ფუნქციურ დონეზე. ამჟამად, მეტაპროტეომების მონაცემთა ბაზის აგების ოქროს სტანდარტი არის ცილის თანმიმდევრობის მონაცემთა ბაზა, რომელიც დაფუძნებულია მეტაგენომზე. ამავდროულად, საჯარო მონაცემთა ფილტრაციის მეთოდს, რომელიც დაფუძნებულია განმეორებით ძიებაზე, ასევე დადასტურდა, რომ აქვს ძლიერი პრაქტიკული მნიშვნელობა. მონაცემთა ანალიზის კონკრეტული სტრატეგიების პერსპექტივიდან, პეპტიდზე ორიენტირებული DIA მონაცემთა ანალიზის მეთოდებმა დაიკავეს აბსოლუტური ძირითადი. ღრმა სწავლისა და ხელოვნური ინტელექტის განვითარებით, ეს მნიშვნელოვნად შეუწყობს ხელს მაკროპროტეომიული მონაცემთა ანალიზის სიზუსტეს, დაფარვას და ანალიზის სიჩქარეს. ქვედა ბიოინფორმატიკის ანალიზის თვალსაზრისით, ბოლო წლებში შემუშავდა ანოტაციის ინსტრუმენტების სერია, რომელსაც შეუძლია შეასრულოს სახეობების ანოტაცია ცილის, პეპტიდის და გენის დონეზე მიკრობული თემების შემადგენლობის მისაღებად. სხვა ომიკის მეთოდებთან შედარებით, მიკრობული თემების ფუნქციური ანალიზი მაკროპროტეომიკის უნიკალური თვისებაა. მაკროპროტეომიკა გახდა მიკრობული თემების მულტი-ომის ანალიზის მნიშვნელოვანი ნაწილი და ჯერ კიდევ აქვს განვითარების დიდი პოტენციალი დაფარვის სიღრმის, გამოვლენის მგრძნობელობისა და მონაცემთა ანალიზის სისრულის თვალსაზრისით.

 

01 ნიმუშის წინასწარი დამუშავება

ამჟამად მეტაპროტეომიკის ტექნოლოგია ფართოდ გამოიყენება ადამიანის მიკრობიომის, ნიადაგის, საკვების, ოკეანის, აქტიური ლამის და სხვა სფეროების კვლევაში. ერთი სახეობის პროტეომის ანალიზთან შედარებით, რთული ნიმუშების მეტაპროტეომის ნიმუშის წინასწარი დამუშავება უფრო მეტ გამოწვევას აწყდება. რეალურ ნიმუშებში მიკრობული შემადგენლობა რთულია, სიმრავლის დინამიური დიაპაზონი დიდია, სხვადასხვა ტიპის მიკროორგანიზმების უჯრედის კედლის სტრუქტურა ძალიან განსხვავებულია და ნიმუშები ხშირად შეიცავს დიდი რაოდენობით მასპინძელ ცილებს და სხვა მინარევებს. ამიტომ, მეტაპროტეომის ანალიზისას, ხშირად საჭიროა სხვადასხვა ტიპის ნიმუშების ოპტიმიზაცია და სხვადასხვა მიკრობული გამოყოფის, გამდიდრების, ექსტრაქციისა და ლიზისის სქემების მიღება.

სხვადასხვა ნიმუშებიდან მიკრობული მეტაპროტეომების მოპოვებას აქვს გარკვეული მსგავსება და გარკვეული განსხვავებები, მაგრამ ამჟამად არ არსებობს ერთიანი წინასწარი დამუშავების პროცესი სხვადასხვა ტიპის მეტაპროტეომის ნიმუშებისთვის.

 

02 მასის სპექტრომეტრიის მონაცემების მიღება

თოფის პროტეომის ანალიზისას, პეპტიდური ნარევი წინასწარი დამუშავების შემდეგ ჯერ გამოყოფილია ქრომატოგრაფიულ სვეტში, შემდეგ კი იონიზაციის შემდეგ მონაცემების მისაღებად შედის მასის სპექტრომეტრში. ერთი სახეობის პროტეომის ანალიზის მსგავსად, მაკროპროტეომების ანალიზში მასობრივი სპექტრომეტრიის მონაცემების შეძენის რეჟიმები მოიცავს DDA რეჟიმს და DIA რეჟიმს.

 

მასობრივი სპექტრომეტრიის ინსტრუმენტების უწყვეტი გამეორებით და განახლებით, მასობრივი სპექტრომეტრიის ინსტრუმენტები უფრო მაღალი მგრძნობელობისა და გარჩევადობის მქონე მეტაპროტეომზე გამოიყენება და მეტაპროტეომის ანალიზის დაფარვის სიღრმე ასევე მუდმივად უმჯობესდება. დიდი ხნის განმავლობაში, მასობრივი სპექტრომეტრიის მაღალი გარჩევადობის ინსტრუმენტების სერია ორბიტრაპის ხელმძღვანელობით ფართოდ გამოიყენება მეტაპროტეომაში.

 

თავდაპირველი ტექსტის ცხრილი 1 გვიჩვენებს რამდენიმე წარმომადგენლობით კვლევას მეტაპროტეომიკაზე 2011 წლიდან დღემდე, ნიმუშის ტიპის, ანალიზის სტრატეგიის, მასის სპექტრომეტრიის ინსტრუმენტის, შეძენის მეთოდის, ანალიზის პროგრამული უზრუნველყოფის და იდენტიფიკაციის რაოდენობის თვალსაზრისით.

 

03 მასის სპექტრომეტრიის მონაცემთა ანალიზი

3.1 DDA მონაცემთა ანალიზის სტრატეგია

3.1.1 მონაცემთა ბაზის ძიება

3.1.2დე ნოვოთანმიმდევრობის სტრატეგია

3.2 DIA მონაცემთა ანალიზის სტრატეგია

 

04სახეობების კლასიფიკაცია და ფუნქციური ანოტაცია

მიკრობული თემების შემადგენლობა სხვადასხვა ტაქსონომიურ დონეზე არის მიკრობიომის კვლევის ერთ-ერთი მთავარი კვლევის სფერო. ბოლო წლებში შემუშავდა ანოტაციის ინსტრუმენტების სერია ცილის, პეპტიდისა და გენის დონეზე სახეობების ანოტაციისთვის მიკრობული თემების შემადგენლობის მისაღებად.

 

ფუნქციური ანოტაციის არსი არის სამიზნე ცილის თანმიმდევრობის შედარება ფუნქციური ცილის თანმიმდევრობის მონაცემთა ბაზასთან. გენის ფუნქციების მონაცემთა ბაზების გამოყენებით, როგორიცაა GO, COG, KEGG, eggNOG და ა.შ., სხვადასხვა ფუნქციური ანოტაციის ანალიზი შეიძლება ჩატარდეს მაკროპროტეომების მიერ იდენტიფიცირებულ ცილებზე. ანოტაციის ხელსაწყოები მოიცავს Blast2GO, DAVID, KOBAS და ა.შ.

 

05 რეზიუმე და Outlook

მიკროორგანიზმები მნიშვნელოვან როლს ასრულებენ ადამიანის ჯანმრთელობასა და დაავადებაში. ბოლო წლებში მეტაპროტეომიკა გახდა მნიშვნელოვანი ტექნიკური საშუალება მიკრობული თემების ფუნქციის შესასწავლად. მეტაპროტეომიკის ანალიტიკური პროცესი მსგავსია ერთი სახეობის პროტეომიკის, მაგრამ მეტაპროტეომიკის კვლევის ობიექტის სირთულის გამო, კვლევის სპეციფიკური სტრატეგიები უნდა იქნას მიღებული ყოველ საანალიზო ეტაპზე, ნიმუშის წინასწარი დამუშავებიდან, მონაცემთა შეგროვებიდან მონაცემთა ანალიზამდე. დღეისათვის, წინასწარი დამუშავების მეთოდების გაუმჯობესების, მასსპექტრომეტრიის ტექნოლოგიის უწყვეტი ინოვაციებისა და ბიოინფორმატიკის სწრაფი განვითარების წყალობით, მეტაპროტეომიკამ მიაღწია დიდ პროგრესს იდენტიფიკაციის სიღრმესა და გამოყენების ასპექტში.

 

მაკროპროტეომის ნიმუშების წინასწარი დამუშავების პროცესში პირველ რიგში გასათვალისწინებელია ნიმუშის ბუნება. როგორ განვაცალკევოთ მიკროორგანიზმები გარემოს უჯრედებიდან და ცილებისგან, არის მაკროპროტეომების წინაშე მდგარი ერთ-ერთი მთავარი გამოწვევა, და ბალანსი განცალკევების ეფექტურობასა და მიკრობების დაკარგვას შორის გადაუდებელი პრობლემაა. მეორეც, მიკროორგანიზმების ცილის ექსტრაქციამ უნდა გაითვალისწინოს სხვადასხვა ბაქტერიების სტრუქტურული ჰეტეროგენურობით გამოწვეული განსხვავებები. მაკროპროტეომის ნიმუშები კვალის დიაპაზონში ასევე მოითხოვს წინასწარ დამუშავების სპეციფიკურ მეთოდებს.

 

მასობრივი სპექტრომეტრიის ინსტრუმენტების თვალსაზრისით, მასობრივი სპექტრომეტრიის ინსტრუმენტებმა გაიარეს გადასვლა მასის სპექტრომეტრებიდან, რომლებიც დაფუძნებულია Orbitrap-ის მასის ანალიზატორებზე, როგორიცაა LTQ-Orbitrap და Q Exactive, მასის სპექტრომეტრებზე, რომლებიც დაფუძნებულია იონების მობილურობასთან დაკავშირებულ ფრენის დროის მასის ანალიზატორებზე, როგორიცაა timsTOF Pro. . ინსტრუმენტების timsTOF სერიას იონის მობილურობის განზომილების შესახებ ინფორმაციის მქონე ინსტრუმენტების მაღალი გამოვლენის სიზუსტე, დაბალი აღმოჩენის ლიმიტი და კარგი განმეორებადობა აქვს. ისინი თანდათანობით გახდნენ მნიშვნელოვანი ინსტრუმენტები სხვადასხვა კვლევის სფეროებში, რომლებიც საჭიროებენ მასის სპექტრომეტრიის გამოვლენას, როგორიცაა ერთი სახეობის პროტეომი, მეტაპროტეომი და მეტაბოლომი. აღსანიშნავია, რომ დიდი ხნის განმავლობაში, მასობრივი სპექტრომეტრიის ინსტრუმენტების დინამიური დიაპაზონი ზღუდავდა მეტაპროტეომის კვლევის ცილოვანი დაფარვის სიღრმეს. მომავალში, მასობრივი სპექტრომეტრიის ინსტრუმენტებს უფრო დიდი დინამიური დიაპაზონით შეუძლიათ გააუმჯობესონ მეტაპროტეომებში ცილების იდენტიფიკაციის მგრძნობელობა და სიზუსტე.

 

მასობრივი სპექტრომეტრიის მონაცემების მისაღებად, მიუხედავად იმისა, რომ DIA მონაცემთა შეძენის რეჟიმი ფართოდ იქნა მიღებული ერთი სახეობის პროტეომებში, მაკროპროტეომების მიმდინარე ანალიზების უმეტესობა კვლავ იყენებს DDA მონაცემთა შეძენის რეჟიმს. DIA მონაცემთა შეძენის რეჟიმს შეუძლია სრულად მიიღოს ნიმუშის ფრაგმენტული იონური ინფორმაცია და DDA მონაცემთა შეძენის რეჟიმთან შედარებით, მას აქვს პოტენციალი სრულად მიიღოს მაკროპროტეომის ნიმუშის პეპტიდური ინფორმაცია. თუმცა, DIA მონაცემების მაღალი სირთულის გამო, DIA მაკროპროტეომის მონაცემების ანალიზი ჯერ კიდევ დიდი სირთულეების წინაშე დგას. მოსალოდნელია, რომ ხელოვნური ინტელექტისა და ღრმა სწავლის განვითარება გააუმჯობესებს DIA მონაცემთა ანალიზის სიზუსტეს და სისრულეს.

 

მეტაპროტეომიკის მონაცემთა ანალიზის დროს, ერთ-ერთი საკვანძო ნაბიჯი არის ცილის თანმიმდევრობის მონაცემთა ბაზის აგება. პოპულარული კვლევის სფეროებისთვის, როგორიცაა ნაწლავის ფლორა, შეიძლება გამოყენებულ იქნას ნაწლავის მიკრობული მონაცემთა ბაზები, როგორიცაა IGC და HMP, და მიღწეულია კარგი იდენტიფიკაციის შედეგები. სხვა მეტაპროტეომიკური ანალიზების უმეტესობისთვის, მონაცემთა ბაზის მშენებლობის ყველაზე ეფექტური სტრატეგია მაინც არის ნიმუშის სპეციფიკური ცილის თანმიმდევრობის მონაცემთა ბაზის შექმნა, რომელიც დაფუძნებულია მეტაგენომიური თანმიმდევრობის მონაცემებზე. მაღალი სირთულის და დიდი დინამიური დიაპაზონის მქონე მიკრობული საზოგადოების ნიმუშებისთვის, საჭიროა გაიზარდოს თანმიმდევრობის სიღრმე, რათა გაიზარდოს დაბალი სიმრავლის სახეობების იდენტიფიკაცია, რითაც გაუმჯობესდება ცილების თანმიმდევრობის მონაცემთა ბაზის დაფარვა. როდესაც მონაცემების თანმიმდევრობა აკლია, განმეორებითი ძიების მეთოდი შეიძლება გამოყენებულ იქნას საჯარო მონაცემთა ბაზის ოპტიმიზაციისთვის. თუმცა, განმეორებითმა ძიებამ შეიძლება გავლენა მოახდინოს FDR ხარისხის კონტროლზე, ამიტომ ძიების შედეგები გულდასმით უნდა შემოწმდეს. გარდა ამისა, FDR ხარისხის კონტროლის ტრადიციული მოდელების გამოყენებადობა მეტაპროტეომიურ ანალიზში ჯერ კიდევ ღირს შესასწავლად. ძიების სტრატეგიის თვალსაზრისით, ჰიბრიდული სპექტრული ბიბლიოთეკის სტრატეგიას შეუძლია გააუმჯობესოს DIA მეტაპროტეომიკის დაფარვის სიღრმე. ბოლო წლების განმავლობაში, ღრმა სწავლაზე დაფუძნებულმა პროგნოზირებულმა სპექტრულმა ბიბლიოთეკამ აჩვენა უმაღლესი შესრულება DIA პროტეომიკაში. თუმცა, მეტაპროტეომების მონაცემთა ბაზები ხშირად შეიცავს მილიონობით ცილის ჩანაწერს, რაც იწვევს ფართო მასშტაბის პროგნოზირებულ სპექტრულ ბიბლიოთეკებს, მოიხმარს უამრავ გამოთვლით რესურსს და იწვევს დიდ საძიებო სივრცეს. გარდა ამისა, მეტაპროტეომებში ცილოვანი თანმიმდევრობების მსგავსება მნიშვნელოვნად განსხვავდება, რაც ართულებს სპექტრული ბიბლიოთეკის პროგნოზირების მოდელის სიზუსტის უზრუნველყოფას, ამიტომ პროგნოზირებული სპექტრული ბიბლიოთეკები ფართოდ არ გამოიყენება მეტაპროტეომიკაში. გარდა ამისა, უნდა შემუშავდეს ახალი ცილის დასკვნისა და კლასიფიკაციის ანოტაციის სტრატეგიები, რათა გამოიყენონ მაღალი თანმიმდევრობის მსგავსი ცილების მეტაპროტეომიკური ანალიზი.

 

მოკლედ, როგორც მიკრობიომის კვლევის განვითარებადი ტექნოლოგია, metaproteomics ტექნოლოგიამ მიაღწია მნიშვნელოვან კვლევის შედეგებს და ასევე აქვს განვითარების უზარმაზარი პოტენციალი.


გამოქვეყნების დრო: აგვისტო-30-2024