دانلود کامل ترین جزوه بیوانفورماتیک

جزوه تایپ شده بیوانفورماتیک

دکتر مطهره محسن پور دانشگاه پیام نور بابک باباعباسی علمی کاربردی محمد نجفی و اباذر روستا زاده میانده آزاد کاردانی کارشناسی ارشد جین‌میشل

‌‌‌[14] [15] [16][17] ‌‌‌‌‌‌‌‌‌‌‌‌‌[19][20]

() () [21] شناسی محاسباتی نامیده می شود . زیرشاخه های مهم در بیوانفورماتیک و زیست شناسی محاسباتی عبارتند از:

توسعه و اجرای برنامه های کامپیوتری که امکان دسترسی کارآمد، مدیریت و استفاده از انواع مختلف اطلاعات را فراهم می کند.
توسعه الگوریتم‌های جدید (فرمول‌های ریاضی) و معیارهای آماری که روابط بین اعضای مجموعه داده‌های بزرگ را ارزیابی می‌کند. به عنوان مثال، روش‌هایی برای تعیین مکان یک ژن در یک توالی، پیش‌بینی ساختار و/یا عملکرد پروتئین، و خوشه‌بندی توالی‌های پروتئین در خانواده‌هایی از توالی‌های مرتبط وجود دارد.
هدف اولیه بیوانفورماتیک افزایش درک فرآیندهای بیولوژیکی است. با این حال، آنچه آن را از سایر رویکردها متمایز می کند، تمرکز آن بر توسعه و بکارگیری تکنیک های محاسباتی فشرده برای دستیابی به این هدف است. مثال‌ها عبارتند از: تشخیص الگو ، داده‌کاوی ، الگوریتم‌های یادگیری ماشین ، و تجسم . تلاش‌های تحقیقاتی عمده در این زمینه شامل هم‌ترازی جزوه بیوانفورماتیک، یافتن ژن ، مونتاژ ژنوم ، طراحی دارو ، کشف دارو ، تراز ساختار پروتئین ، پیش‌بینی ساختار پروتئین ، پیش‌بینیبیان ژن و فعل و انفعالات پروتئین-پروتئین ، مطالعات ارتباط ژنومی ، مدل‌سازی تکامل و تقسیم سلولی/میتوز.

بیوانفورماتیک در حال حاضر مستلزم ایجاد و پیشرفت پایگاه‌های داده، الگوریتم‌ها، تکنیک‌های محاسباتی و آماری و تئوری برای حل مشکلات رسمی و عملی ناشی از مدیریت و تجزیه و تحلیل داده‌های بیولوژیکی است.

در طول چند دهه گذشته، پیشرفت های سریع در فناوری های تحقیقاتی ژنومی و دیگر مولکولی و تحولات در فناوری اطلاعات با هم ترکیب شده اند تا حجم عظیمی از اطلاعات مربوط به زیست شناسی مولکولی را تولید کنند. بیوانفورماتیک نامی است که به این رویکردهای ریاضی و محاسباتی داده شده است که برای درک درستی از فرآیندهای بیولوژیکی استفاده می شود.

بیوانفورماتیک

فعالیت های رایج در بیوانفورماتیک شامل نقشه برداری و تجزیه و تحلیل توالی های DNA و پروتئین، تراز کردن توالی DNA و پروتئین برای مقایسه آنها، و ایجاد و مشاهده مدل های سه بعدی از ساختارهای پروتئینی است.

ارتباط با سایر زمینه ها
بیوانفورماتیک یک رشته علمی است که شبیه محاسبات بیولوژیکی اما متمایز از آن است، در حالی که اغلب مترادف زیست شناسی محاسباتی در نظر گرفته می شود . محاسبات بیولوژیکی از مهندسی زیستی و زیست شناسی برای ساخت رایانه های بیولوژیکی استفاده می کند ، در حالی که بیوانفورماتیک از محاسبات برای درک بهتر زیست شناسی استفاده می کند. بیوانفورماتیک و زیست شناسی محاسباتی شامل تجزیه و تحلیل داده های بیولوژیکی، به ویژه DNA، RNA، و توالی پروتئین است. زمینه بیوانفورماتیک رشد انفجاری را از اواسط دهه 1990 تجربه کرد که عمدتاً توسط پروژه ژنوم انسانی و پیشرفت های سریع در فناوری توالی یابی DNA انجام شد.

تجزیه و تحلیل داده های بیولوژیکی برای تولید اطلاعات معنی دار شامل نوشتن و اجرای برنامه های نرم افزاری است که از الگوریتم های نظریه گراف ، هوش مصنوعی ، محاسبات نرم ، داده کاوی ، پردازش تصویر و شبیه سازی کامپیوتری استفاده می کنند. الگوریتم ها به نوبه خود به مبانی نظری مانند ریاضیات گسسته ، نظریه کنترل ، نظریه سیستم ، نظریه اطلاعات و آمار بستگی دارند .

تحلیل توالی
مقاله‌های اصلی: هم‌ترازی توالی ، پایگاه‌داده توالی ، و تحلیل توالی بدون تراز
از زمانی که فاژ Φ-X174 در سال 1977 توالی یابی شد، [22] توالی DNA هزاران جاندار رمزگشایی و در پایگاه های داده ذخیره شده است. این اطلاعات توالی برای تعیین ژن‌هایی که پروتئین‌ها ، ژن‌های RNA، توالی‌های تنظیمی، موتیف‌های ساختاری و توالی‌های تکراری را کد می‌کنند، تجزیه و تحلیل می‌شود. مقایسه ژن‌ها در یک گونه یا بین گونه‌های مختلف می‌تواند شباهت‌های بین عملکرد پروتئین یا روابط بین گونه‌ها را نشان دهد (استفاده از سیستماتیک مولکولی برای ساخت درختان فیلوژنتیک ). با افزایش حجم داده ها، مدت ها پیش تجزیه و تحلیل دستی توالی های DNA غیرعملی شد. برنامه های کامپیوتریاز جمله BLAST به طور معمول برای جستجوی توالی ها استفاده می شود – از سال 2008، از بیش از 260000 موجود زنده، حاوی بیش از 190 میلیارد نوکلئوتید . [23]

جزوه بیوانفورماتیک دانلود رایگان خلاصه کتاب پی دی اف

تصویر: 450 پیکسل مراحل تجزیه و تحلیل توالی
توالی یابی DNA
مقاله اصلی: توالی یابی DNA
قبل از تجزیه و تحلیل توالی ها باید از بانک ذخیره سازی داده ها به عنوان مثال Genbank به دست آیند. تعیین توالی DNA هنوز یک مشکل غیر ضروری است زیرا داده های خام ممکن است نویز داشته باشند یا تحت تأثیر سیگنال های ضعیف قرار گیرند. الگوریتم‌هایی برای فراخوانی پایه برای رویکردهای تجربی مختلف برای توالی‌یابی DNA توسعه یافته‌اند.

مونتاژ سکانس
مقاله اصلی: مونتاژ توالی
اکثر تکنیک‌های توالی‌یابی DNA قطعات کوتاهی از توالی را تولید می‌کنند که باید برای به دست آوردن توالی‌های کامل ژن یا ژنوم جمع شوند. به اصطلاح تکنیک توالی تفنگ شاتگان (که برای مثال توسط موسسه تحقیقات ژنومی (TIGR) برای تعیین توالی اولین ژنوم باکتری، هموفیلوس آنفولانزا استفاده شد ) [24]توالی هزاران قطعه کوچک DNA را تولید می کند (از 35 تا 900 نوکلئوتید طول دارد، بسته به فناوری توالی یابی). انتهای این قطعات با هم همپوشانی دارند و هنگامی که توسط یک برنامه مونتاژ ژنوم به درستی در یک راستا قرار گیرند، می توان برای بازسازی ژنوم کامل استفاده کرد. توالی‌یابی تفنگ ساچمه‌ای داده‌های توالی را به سرعت به دست می‌آورد، اما کار مونتاژ قطعات برای ژنوم‌های جزوه بیوانفورماتیک می‌تواند بسیار پیچیده باشد. برای ژنومی به بزرگی ژنوم انسان ، ممکن است چند روز از زمان CPU روی رایانه‌های با حافظه بزرگ و چند پردازنده‌ای برای جمع‌آوری قطعات طول بکشد و مجموعه حاصل معمولاً حاوی شکاف‌های متعددی است که باید بعداً پر شوند. توالی یابی تفنگ ساچمه ای روش انتخابی برای تقریباً همه ژنوم هایی است که امروزه توالی یابی شده اند [ چه زمانی؟ ]و الگوریتم های مونتاژ ژنوم یک حوزه حیاتی از تحقیقات بیوانفورماتیک هستند.

خلاصه کتاب رایگان بیوانفورماتیک

همچنین ببینید: تجزیه و تحلیل توالی ، کاوی توالی ، ابزار پروفایل سازی توالی ، و موتیف توالی
حاشیه نویسی ژنوم
مقاله اصلی: پیش‌بینی ژن
در زمینه ژنومیک ، حاشیه نویسی فرآیند علامت گذاری ژن ها و سایر ویژگی های بیولوژیکی در یک توالی DNA است. این فرآیند باید خودکار شود، زیرا بیشتر ژنوم‌ها برای حاشیه‌نویسی با دست بسیار بزرگ هستند، نه اینکه میل به حاشیه‌نویسی تا آنجایی که ممکن است ژنوم‌ها وجود دارد، زیرا سرعت توالی‌بندی دیگر باعث ایجاد گلوگاه نشده است. حاشیه نویسی با این واقعیت امکان پذیر است که ژن ها دارای مناطق شروع و توقف قابل تشخیص هستند، اگرچه توالی دقیق یافت شده در این مناطق می تواند بین ژن ها متفاوت باشد.

حاشیه نویسی ژنوم را می توان به سه سطح طبقه بندی کرد: سطوح نوکلئوتید، پروتئین و فرآیند.

یافتن ژن یکی از جنبه های اصلی حاشیه نویسی در سطح نوکلئوتید است. برای ژنوم‌های پیچیده، موفق‌ترین روش‌ها از ترکیبی از پیش‌بینی ژن ab initio و مقایسه توالی با پایگاه‌های اطلاعاتی توالی بیان شده و سایر ارگانیسم‌ها استفاده می‌کنند. حاشیه نویسی در سطح نوکلئوتید همچنین امکان ادغام توالی ژنوم با سایر نقشه های ژنتیکی و فیزیکی ژنوم را فراهم می کند.

هدف اصلی حاشیه نویسی در سطح پروتئین، اختصاص عملکرد به محصولات ژنوم است. پایگاه های داده توالی های پروتئینی و حوزه ها و موتیف های عملکردی منابع قدرتمندی برای این نوع حاشیه نویسی هستند. با این وجود، نیمی از پروتئین‌های پیش‌بینی‌شده در یک توالی ژنوم جدید، هیچ عملکرد آشکاری ندارند.

درک عملکرد ژن ها و محصولات آنها در زمینه فیزیولوژی جزوه ایمنی انبار و ارگانیسمی هدف حاشیه نویسی در سطح فرآیند است. یکی از موانع این سطح از حاشیه نویسی، ناهماهنگی اصطلاحات مورد استفاده در سیستم های مدل مختلف است. کنسرسیوم هستی شناسی ژن به حل این مشکل کمک می کند. [25]

اولین توصیف از یک سیستم جزوه بیوانفورماتیک حاشیه نویسی ژنوم در سال 1995 [24] توسط تیمی در موسسه تحقیقات ژنومی منتشر شد که اولین توالی یابی و تجزیه و تحلیل کامل ژنوم یک موجود زنده آزاد، باکتری هموفیلوس آنفولانزا را انجام داد. [24] Owen White یک سیستم نرم افزاری برای شناسایی ژن های کد کننده همه پروتئین ها، RNA های انتقالی، RNA های ریبوزومی (و سایر مکان ها) و انجام وظایف اولیه را طراحی و ساخت. اکثر سیستم های حاشیه نویسی ژنوم فعلی به طور مشابه کار می کنند، اما برنامه های موجود برای تجزیه و تحلیل DNA ژنومی، مانند برنامه GeneMark برای یافتن ژن های کد کننده پروتئین در هموفیلوس آنفولانزا آموزش دیده و استفاده می شود.، دائما در حال تغییر و بهبود هستند.

به دنبال اهدافی که پروژه ژنوم انسانی پس از بسته شدن آن در سال 2003 برای دستیابی به آن باقی ماند، پروژه جدیدی که توسط موسسه ملی تحقیقات ژنوم انسانی در ایالات متحده توسعه یافته بود ظاهر شد. پروژه موسوم به ENCODE یک مجموعه داده مشترک از عناصر عملکردی ژنوم انسان است که از فناوری‌های توالی‌یابی DNA نسل بعدی و آرایه‌های کاشی‌کاری ژنومی استفاده می‌کند، فناوری‌هایی که می‌توانند به طور خودکار مقادیر زیادی داده را با هزینه هر پایه به‌طور چشمگیری تولید کنند. اما با همان دقت (خطای تماس پایه) و وفاداری (خطای اسمبلی).

پیش‌بینی عملکرد ژن
در حالی که حاشیه نویسی ژنوم اساساً بر اساس شباهت توالی (و در نتیجه همسانی ) است، از دیگر ویژگی های توالی ها می توان برای پیش بینی عملکرد ژن ها استفاده کرد. در واقع، بیشتر روش‌های پیش‌بینی عملکرد ژن بر روی توالی‌های پروتئین تمرکز می‌کنند، زیرا آموزنده‌تر و غنی‌تر از ویژگی‌ها هستند. به عنوان مثال، توزیع اسیدهای آمینه آبگریز، بخش های گذرنده در پروتئین ها را پیش بینی می کند . با این حال، پیش‌بینی عملکرد پروتئین می‌تواند از اطلاعات خارجی مانند داده‌های بیان ژن (یا پروتئین)، ساختار پروتئین یا برهمکنش‌های پروتئین-پروتئین نیز استفاده کند . [26]

زیست شناسی تکاملی محاسباتی
اطلاعات بیشتر: فیلوژنتیک محاسباتی
زیست شناسی تکاملی مطالعه منشا و هبوط گونه ها و جزوه بیوانفورماتیک تغییر آنها در طول زمان است. انفورماتیک به زیست شناسان تکاملی کمک کرده است و محققان را قادر می سازد تا:

ردیابی تکامل تعداد زیادی از ارگانیسم‌ها با اندازه‌گیری تغییرات در DNA آنها ، نه از طریق طبقه‌بندی فیزیکی یا مشاهدات فیزیولوژیکی به تنهایی،
مقایسه کل ژنوم ها ، که امکان مطالعه رویدادهای تکاملی پیچیده تر، مانند تکرار ژن ، انتقال افقی ژن ، و پیش بینی عوامل مهم در گونه زایی باکتریایی را فراهم می کند .
ساخت مدل‌های ژنتیکی جمعیت محاسباتی پیچیده برای پیش‌بینی نتیجه سیستم در طول زمان [27]
ردیابی و به اشتراک گذاری اطلاعات در مورد تعداد فزاینده ای از گونه ها و موجودات
کار آینده تلاش می کند تا درخت زندگی را که اکنون پیچیده تر است بازسازی کند . [ به گفته چه کسی؟ ]

حوزه تحقیق در علوم کامپیوتر که از الگوریتم‌های ژنتیک استفاده می‌کند ، گاهی با زیست‌شناسی تکاملی محاسباتی اشتباه گرفته می‌شود، اما این دو حوزه لزوماً به هم مرتبط نیستند.

ژنومیک مقایسه ای
مقاله اصلی: ژنومیک مقایسه ای
هسته اصلی تجزیه و تحلیل ژنوم مقایسه ای برقراری ارتباط بین ژن ها ( تحلیل ارتولوژی ) یا سایر ویژگی های ژنومی در موجودات مختلف است. این نقشه های بین ژنومی است که ردیابی فرآیندهای تکاملی مسئول واگرایی دو ژنوم را ممکن می کند. انبوهی از رویدادهای تکاملی که در سطوح مختلف سازمانی عمل می‌کنند، تکامل ژنوم را شکل می‌دهند. در پایین ترین سطح، جهش های نقطه ای بر نوکلئوتیدهای فردی تأثیر می گذارد. در سطح بالاتر، بخش های کروموزومی بزرگ دچار تکرار، انتقال جانبی، وارونگی، جابجایی، حذف و درج می شوند. [28] در نهایت، کل ژنوم ها در فرآیندهای هیبریداسیون، پلی پلوئیدی شدن و اندوسیمبیوز نقش دارند.، اغلب منجر به گونه زایی سریع می شود. پیچیدگی تکامل ژنوم، چالش‌های هیجان‌انگیزی را برای توسعه‌دهندگان مدل‌ها و الگوریتم‌های ریاضی ایجاد می‌کند، که به طیفی از تکنیک‌های الگوریتمی، آماری و ریاضی، از دقیق، اکتشافی ، پارامتر ثابت و الگوریتم‌های تقریبی برای مدل‌های مبتنی بر مدل‌های مارکوف جزوه بیوانفورماتیک می‌شوند. الگوریتم های زنجیره ای مونت کارلو برای تحلیل بیزی مسائل بر اساس مدل های احتمالی

بسیاری از این مطالعات بر اساس تشخیص همسانی توالی برای اختصاص توالی به خانواده های پروتئینی است. [29]

پان ژنومیک
نوشتار اصلی: پان ژنوم
پان ژنومیک مفهومی است که در سال 2005 توسط تتلین و مدینی معرفی شد و سرانجام در بیوانفورماتیک ریشه دوانید. ژنوم پان مجموعه کامل ژنی یک گروه طبقه بندی خاص است: اگرچه در ابتدا برای سویه های نزدیک یک گونه به کار می رود، اما می توان آن را در زمینه بزرگتری مانند جنس، شاخه و غیره به کار برد. این ژنوم به دو بخش تقسیم می شود: ژنوم هسته: مجموعه‌ای از ژن‌های مشترک برای همه ژنوم‌های مورد مطالعه (این‌ها اغلب ژن‌های خانه‌داری هستند که برای بقا حیاتی هستند) و ژنوم قابل انعطاف/منعطف: مجموعه‌ای از ژن‌هایی که در همه ژنوم‌ها به جز یک یا برخی از ژنوم‌های مورد مطالعه وجود ندارند. یک ابزار بیوانفورماتیک BPGA می تواند برای مشخص کردن ژنوم پان گونه های باکتری استفاده شود. [30]

ژنتیک بیماری
مقاله اصلی: مطالعات ارتباط ژنومی
با ظهور توالی یابی نسل بعدی، ما در حال به دست آوردن داده های توالی کافی برای نقشه برداری از ژن های بیماری های پیچیده از جمله ناباروری ، [31] سرطان سینه [32] یا بیماری آلزایمر هستیم . [33] مطالعات ارتباط گسترده ژنوم یک رویکرد مفید برای مشخص کردن جهش‌های مسئول چنین بیماری‌های پیچیده‌ای است. [34] از طریق این مطالعات، هزاران نوع DNA شناسایی شده اند که با بیماری ها و ویژگی های مشابه مرتبط هستند. [35]علاوه بر این، امکان استفاده از ژن ها در پیش آگهی، تشخیص یا درمان یکی از ضروری ترین کاربردها است. بسیاری از مطالعات در مورد راه‌های امیدوارکننده برای انتخاب ژن‌های مورد استفاده و مشکلات و مشکلات استفاده از ژن‌ها برای پیش‌بینی حضور یا پیش‌آگهی بیماری بحث می‌کنند. [36]

مطالعات ارتباط ژنومی با موفقیت هزاران گونه ژنتیکی رایج را برای بیماری ها و صفات پیچیده شناسایی کرده است. با این حال، این گونه های رایج تنها بخش کوچکی از وراثت پذیری را توضیح می دهند. [37] گونه‌های نادر ممکن است برخی از وراثت‌پذیری‌های گمشده را توجیه کنند. [38] مطالعات توالی یابی کل ژنوم در مقیاس بزرگ به سرعت میلیون ها ژنوم کامل را توالی یابی کرده اند و چنین مطالعاتی صدها میلیون گونه نادر را شناسایی کرده است. [39] حاشیه نویسی عملکردیپیش‌بینی اثر یا عملکرد یک نوع ژنتیکی و کمک به اولویت‌بندی انواع عملکردی نادر، و گنجاندن این حاشیه‌نویسی‌ها می‌تواند به طور موثر قدرت ارتباط ژنتیکی تجزیه و تحلیل واریانت‌های نادر را در مطالعات توالی‌یابی کل ژنوم افزایش دهد. [40] برخی از ابزارها برای ارائه تجزیه و تحلیل تداعی انواع نادر یکپارچه برای داده های توالی یابی کل ژنوم، از جمله ادغام داده های ژنوتیپ و حاشیه نویسی های عملکردی آنها، تجزیه و تحلیل ارتباط، خلاصه نتایج و تجسم ایجاد شده اند. [41] [42]

تجزیه و تحلیل جهش در سرطان
مقاله اصلی: انکوژنومیکس
در سرطان ، ژنوم سلول‌های آسیب‌دیده به روش‌های پیچیده یا حتی غیرقابل پیش‌بینی بازآرایی می‌شوند. تلاش‌های توالی‌یابی گسترده برای شناسایی جهش‌های نقطه‌ای ناشناخته قبلی در انواع ژن‌های سرطان استفاده می‌شود. بیوانفورماتیکان به تولید سیستم‌های خودکار تخصصی برای مدیریت حجم عظیم داده‌های توالی تولید شده ادامه می‌دهند و الگوریتم‌ها و نرم‌افزارهای جدیدی را برای مقایسه نتایج توالی‌یابی با مجموعه رو به رشد توالی‌های ژنوم انسانی و پلی‌مورفیسم‌های مولفه ایجاد می‌کنند. فن‌آوری‌های جدید تشخیص فیزیکی، مانند ریزآرایه‌های الیگونوکلئوتیدی برای شناسایی سود و زیان کروموزومی (به نام هیبریداسیون مقایسه‌ای ژنومی ) استفاده می‌شوند.، و آرایه های پلی مورفیسم تک نوکلئوتیدی برای تشخیص جهش های نقطه ای شناخته شده . این روش‌های تشخیص همزمان چند صد هزار مکان را در جزوه بیوانفورماتیک ژنوم اندازه‌گیری می‌کنند، و هنگامی که در توان عملیاتی بالا برای اندازه‌گیری هزاران نمونه استفاده می‌شوند، در هر آزمایش ، ترابایت داده تولید می‌کنند. باز هم مقادیر انبوه و انواع جدید داده ها فرصت های جدیدی را برای بیوانفورماتیکان ایجاد می کند. داده‌ها اغلب حاوی تغییرات یا نویز قابل‌توجهی هستند و بنابراین مدل Hidden Markov و روش‌های تحلیل نقطه تغییر برای استنتاج تغییرات تعداد کپی واقعی توسعه می‌یابند .

دو اصل مهم را می توان در تجزیه و تحلیل ژنوم سرطان از نظر بیوانفورماتیک مربوط به شناسایی جهش در اگزوم استفاده کرد. اول، سرطان بیماری جهش‌های جسمی انباشته شده در ژن‌ها است. سرطان دوم حاوی جهش های راننده است که باید از [43]

‌‌‌‌‌[44]

‌‌‌‌‌‌()، ‌()، ‌()، -“” () ‌/‌‌[45] ‌‌: ‌‌‌‌‌‌‌‌‌

فهرست مطالب

دانلود کامل ترین جزوه بیوانفورماتیک

دکتر مطهره محسن پور دانشگاه پیام نور بابک باباعباسی علمی کاربردی محمد نجفی و اباذر روستا زاده میانده آزاد کاردانی کارشناسی ارشد جین‌میشل

جزوه بیوانفورماتیک دانلود رایگان خلاصه کتاب پی دی اف

دیدگاهتان را بنویسید لغو پاسخ