جزوه تایپ شده کاربرد کامپیوتر در علوم زیستی
رشته زیست شناسی دانشگاه پیام نور پیام نور حاجیحسینی پیام نور غلامپیام نور بخشیخانیکی دانشگاه علمی کاربردی پیام
:
: -: –! -:
-:
—<->-:
—/ -:–
– : > > spss نرم افزار
Legacy Dialogs> 1Sample K-S.
پس از رفتن به مسیر بالا به صفحه زیر هدایت خواهید شد. در این صفحه متغیری که میخواهید مورد آزمون قرار گیرد را انتخاب و در کادر Test Variable List وارد کنید. سپس Ok را بزنید.
پس از اینکه کارهای بالا را انجام دادید، نرم افزار یک خروجی همانند شکل زیر را به شما خواهد داد. در خروجی زیر دو سطر آخر مورد نظر ما خواهد بود و گزارش خواهند شد. همانطور که مشاهده میشود یک Z و یک Sig آمده است. اگر Sig کوچک تر از ۵ صدم بود یعنی آزمون معنی دار شده و باید از آزمونهای ناپارامتریک استفاده شود. در شکل زیر معنی داری به دست نیامده و بنابراین میتوان برای مقایسه سن در دو گروه از آزمون t مستقل استفاده کرد.
2- همگن بودن واریانس )فاصله داده از میانگین:(
برای همگن بودن واریانس ها و آگاهی از آن از دو آزمون Cochra’s test و Lenene’s test جزوه کاربرد کامپیوتر در علوم زیستی می شود در این دو آزمون اگر p-value<0.05 بدان معنی است که واریانس داده ها همگن نیست ولی اگر p-value>0.05 واریانس داده ها همگن است .
3- استقلال نمونه ها از یکدیگر:
برداشت یک نمونه تاثیری بر نمونه ی دیگر نداشته باشد
transforming variable انتقال یا تبدیل داد ها
منظور از انتقال یا تبدیل ها عملیات ریاضی روی داده ها است.
انتقال یا تبدیل داده ها به 3 منظور صورت می گیرد:
1-خطی کردن ارتباط متغیر ها
2-نرمال کردن داده ها
3-همگن کردن واریانس ها
1- خطی کردن ارتباط داده ها: در مواقعی که به دنبال بررسی ارتباط میان دو متغیر هستیم در صورتی که ارتباط دو متغیر از طریق رسم منحنی خطی نباشد برای بیان ارتباط بهتر است از تبدیل یا انتقال داده ها ارتباط میان دو متغیر را خطی و سپس ارتباط را در یابیم . بسیاری از متغیر ها فاقد ارتباط خطی هستند مانند رشد جمعیت در سال های متفاوت ، تحصیل و میزان در آمد ، اما بعضی ارتباط ها نیز خطی می باشند.
روش های مختلف انتقال یا تبدیل داده ها:
1- انتقال به روش log
بیشتر برای داده های محیطی)دما، بارندگی ، جمعیت و ..( استفاده می شود ولی شرط استفاده از این روش ین است که درداده ها صفر وجود نداشته باشد اگر کوچکترین داده ها صفر باشد به همه ی داده ها یم واحد اضافه می کنیم و اگر در بین داده ها کوچکترین داده 1- باشد به قدر مطلق آن و به همه داده ها یک واحد می افزاییم.
2- : arc sin روش
هنگامی که داده ها به صورت درصد باشند شرط استفاده از این روش قرار گرفتن داده ها در بازه ی
)1 و 1- ( می باشد داده ها ابتدا تقسیم بر 100 میکنیم و سپس جزوه کاربرد کامپیوتر در علوم زیستی را انجام می دهیم
3- ریشه دوم یا چهارم گرفتن داده ها:
بیشتر برای داده های فراوانی به کار می روند
4- معکوس کردن:
هر عددی که داریم به جز صفر را معکوس می کنیم اگر صفر داشتیم با یک جکع می کنیم اگر 1- داشتیم به قدر مطلق همه 1 واحد می افزاییم.
5- رتبه دهی:
دانلود جزوه کاربرد کامپیوتر در علوم زیستی رایگان خلاصه کتاب کامل pdf
بر مبنای مقایسه ی میانگین
از پنج روش بالا برای حل 3 مساله ی مذکور استفاده می شود .
6- به توان دو رساندن:
از این روش برای حل عدم خطی بودن استفاده می کنیم.
7- حضور یا عدم حضور:
در صورت وجود عدد یک و در غیر اینصورت عدد 0 را اختصاص می دهیم و کاری به فراوانی نداریم
Correlation به بررسی همسویی یا عدم همسویی تغییرات دو متغیر می پردازد در صورتی که Regression تغییرات یک متغیر را در گرو تغییرات یک یا چند متغیر مستقل بررسی می کند به عبارت دیگر در آزمون Regression می توان مقادیر یک متغیر وابسته را بر اساس مقادیر یک یا چند متغیر مستقل محاسبه نمود .
روابطی نظیر تغییرات قدر پسران و پدرانشان ، میزان قند خون با میزان مصرف قند ، میزان قند خون با میزان مصرف قند و میزان فشار خون با میزان نمک مصرفی نه تنها Correlation بلکه Regression نیز می باشند در صورتیکه ارتباط میان این دو متغیر قدر پسران و قد دختران در یک فامیل فقط Correlation می باشد.
! در آزمون Correlation تفاوتی کیان متغیر وابسته و مستقل وجود ندارد در صورتی که در Regression متغیر وابسته همیشه در محور y و متغیر مستقل در محور x قرار می گیرد .
در آزمون Correlation چند مولفه ی زیر در محاسبه در نظر گرفته می شود.
1- : Correlation ضریب
Parametric pearson :نرمال non-parametric spearman :غیر نرمال
! نوع ضریب استفاده شده و دلیل استفاده از آن حتما ذکر شود .
-1<r<1
Moderate r=+0.5 /-0.5
Strong : r= +0.75 / -0.75
Very strong : r= +1 / -1
2- علامت ضریب
مستقیم Direct +
– Indirect غیر مستقیم
3- معنی دار بودن رابطه :
p-value<0.05 ارتباط معنی دار نیست p-value>0.05 ارتباط معنی داراست
؟ در آزمایشی وزن تر برگ یک گیاه مشخص و میزان کلروفیل a ,b در آن سنجش شده است ارتباط میان دو متغیر را بیابید .
برای کتر از 50 داده از آزمون Shapiro-wilk برای نرمال بودن استفاده می شود نتایج آزمون نشان دا متغیر وزن تر گیاه دارای توزیع نرمال ولی دو متغیر کلروفیل a,b فاقد توزیع نرمال هستند لذا از ضریب همبستگی Spearman برای بررسی Correlation میان متغیر ها استفاده می شود Ww chl a 0.375-r=
N=25 ارتباط معنی دار وجود ندارد
P=0.065 Ww chl b r= -0.265 N=25 ارتباط معنی دار وجود
ندارد
P=0.216
Chl a , chl b r=0.579 نتایج نشان داد که دو کلروفیل دارای یک ارتباط مستقیم و معنی دار N=25
هستند

دانلود رایگان خلاصه کتاب کاربرد کامپیوتر در علوم زیستی
P=0.002
:partial correlationآزمون
میزان تاثیر یک یا چند کتغیر را روی ارتباط میان دو متغیر بررسی می کند بخه عنوان مثال در مثال بالا میخواهیم بدانیم آیا ارتباط میان دو متغیر chl a , chl b متاثر از وزن گیاه می باشند یا خیر برای این منظور از آزمون partial correlation استفاده می کنیم .اگر آزمون partial correlation در نقطه نظر معنی دار بودن ارتباط میان دو متغیر تغییر کرد نتیجه می جزوه تحلیل غیر خطی متغیر وزن تر گیاه بر روی ارتباط میان دو متغیر کلروفیل A , B تاثیر معنی داری گذاشته است .
نتایج آزمونpartial correlation نشان داد یک ارتباط مستقیم متوسط معنی دار بین دو متغیر chl a , b برقرار است r=0.427
پس نتیجه می گیریم وزن تر گیاه بر ارتباط میان دو متغیر chl a, b بی تاثیر است . n=22 p=0.038
در آزمون regression مولفه های زیر را در نظر میگیرند
1- ضریب همبستگی:
0<r square <1
2- منحنی رگرسیون:
محور x بیانگر متغیر مستقل و محور y بیانگر متغیر وابسته است .
3- فرمول خط منحنی:
Y = ??? که در آن a بیانگر عدد ثابت عرض از مبدا ، X بیامگر متغیر مستقل و b بیانگر شیب خط می باشد .
4- معنی دار بودن ارتباط:
اگر تنها یک متغیر مستقل داشته باشیم از آزمون simple regression جزوه کاربرد کامپیوتر در علوم زیستی می شود و اگر چند متغیر داشتیم از multiple استفاده می کنیم .
در مثال قبل می خواهیم وزن تر گیاه بر روی chl a را محاسبه نماییم . پس وزن تر گیاه متغیر مستقل و کلروفیل متغیر وابسته ی ما خواهند بود .
Y =???
باشد : بایست محقق های زیر می پیش فرض آزمون جهت استفاده از این
ای فاصله سنجش سطح در -متغیر ها
باشند . نرمال نزدیک به یا نرمال -توزیع متغیرهای
نتیجه ی آزمون رگرسیون نشان داد ارتباط 26.0 = 2?
ضعیف و معنی داری بین کلروفیل و وزن تر گیاه وجود دارد P=0.009
.a=0.871
.b=-2.578
-بین دو متغیر رابطه خطی وجود داشته باشد .
جهت سنجش نرمال بودن توزیع متغیر ها از آزمون Shapiro-Wilkو یا -Kolmogoro
smirnovاستفاده می کنیم .
جهت سنجش وجود رابطه خطی بین دو متغیر نیز از آزمون همبستگی پیرسون استفاده می کنیم. اجرا
.را دنبال می کنیم …Analyze › Regression › Linear مسیر
حالا شما کادر زیر را مشاهده می کنید:
2-متغیر مستقل )پیش بین( یا همان درآمد را به داخل کادر Independentانتقال می دهیم .
متغیر وابسته یا همان قیمت خودرو را وارد کادر Dependentمی کنیم . روش (Method)اجرای رگرسیون را نیز مطابق پیش فرض رگرسیون، یعنی همان (Enter)انتخاب می کنیم.
3-بر روی okکلیک می کنیم.
تفسیر نتایج
نرم افزار spssچند جدول را جهت تحلیل ارائه می دهند. در این مبحث ما به مهم ترین این جداول می پردازیم. اولین جدول Model Summaryبه معنای خلاصه مدل است. این جدول مقادیر Rو 2Rرا نشان می دهد. مقدار Rبرابر است با 0.873، اشاره دارد به همبستگی ساده بین دو متغیر و به عبارتی شدت همبستگی بین دو متغیر را نشان می دهد. همان طور که از مقدار R)همبستگی پیرسون بین دو متغیر( نمایان است، بین دو متغیر در آمد و قیمت ماشین همبستگی
در حد خیلی قوی وجود دارد .
مقدار 2Rنشان می دهد که چه مقدار از متغیر وابسته یعنی قیمت ماشین، می تواند توسط متغیر مستقل یعنی درآمد، تبیین شود. در این مثال متغیر درآمد می تواند 76.2درصد از تغییرات متغیر قیمت ماشین را تبیین کند، که در واقع مقدار چشم گیری است.
جدول بعدی ANOVAنام دارد. این جدول نشان می دهد که آیا مدل رگرسیون می تواند به طور معنا داری )و مناسبی( تغییرات متغیر وابسته را پیش بینی کند. برای بررسی معنا داری به ستون آخر جدول (sig) نگاه می کنیم. این ستون معنا داری آماری مدل رگرسیون را نشان می دهد که چنان چه میزان به دست آمده کمتر از 0.05 باشد نتیجه می گیریم که مدل به کار رفته ،پیش بینی کننده خوبی برای متغیر قیمت ماشین است. میزان معنا داری در مثال ما کمتر از میزان
0.05 است که بیان گر این است که مدل رگرسیونی معنا دار است.
جدول زیر Coefficients، اطلاعاتی را در مورد متغیر های پیش بین به ما می دهد. این جدول اطلاعات ضروری برای پیش بین متغیر وابسته را در اختیار ما قرار می دهد. مشاهده می کنیم که مقدار ثابت (constant) و متغیر درآمد هر جزوه کاربرد کامپیوتر در علوم زیستی در مدل معنا دار شده اند )به ستون (sigنگاه می کنیم. پس از تعیین معنا دار بودن مقدار ثابت و متغیر درآمد، ستون Standardized Coefficientsبیانگر ضریب رگرسیونی استاندارد شده یا مقدار بتا است. ضریب رگرسیونی استاندارد شده یا Betaدر مثال ما برابر شده است با 873. که نشان گر میزان تاثیر متغیر مستقل
)درآمد( بر وابسته )قیمت ماشین( است .
نکته :میزان Beta زمانی که یک متغیر مستقل در مدل داریم، با میزان همبستگی پیرسون بین دو متغیر (R) دقیقا برابر است. اما زمانی که بیش از یک متغیر مستقل داشته باشیم، میزان Beta با ضریب همبستگی بین متغیر های مستقل و وابسته تفاوت خواهد داشت.
نکته: کاربرد ضریب Betaهنگامی است که بیش تر از یک متغیر مستقل در مدل داشته باشیم. در این صورت مقدار Betaبه ما کمک می کند که سهم نسبی هر متغیر را در پیش بینی متغیر وابسته مقایسه کنیم و به عبارتی بتوانیم تعیین کنیم که کدام متغیر ها بیش ترین تاثیر را بر متغیر وابسته دارند.
جهت ایجاد معادله رگرسیونی از میزان ضریب رگرسیونی استاندارد نشده (B) استفاده می کنیم .
معادله رگرسیونی جهت پیش بینی دقیق مقادیر متغیر وابسته مورد استفاده قرار می گیرد و معادله آن به صورت زیر است Y = a + bx :
=Yمقدار پیش بینی شده ی متغیر وابسته )قیمت ماشین(
=aعرض از مبدأ نقطه تقاطع خط رگرسیون با محور) Y در جدول: مقدار ثابت یا
constant)
=bشیب خط) ضریب رگرسیونی استاندارد نشده یا (B
=Xمقادیر مختلف متغیر مستقل
معادله رگرسیونی اجرا شدهPrice = 8287 + 0.564 (Income) :
در معادله بالا با قرار دادن مقادیر درآمد افراد، می توان قیمت ماشینی که آنان تمایل به خریدنش را دارند پیش بینی کرد. توجه داشته باشیم که در این معادله مقادیر a و b ثابت است و تنها مقادیر متغیر درآمد تغییر می کند.
آزمون های مفایسه ی مبانگین ها:
دو گروه T-test
چند گروه Anova
در این آزمون چون خود داده ها بررسی نمی شوند اختلاف بررسی می شود این آزمون خود در برگیرنده ی سه آزمون می باشد One sample
Paired sample ___wilcoxen
Independent sample ___mann-withney
! دقت شود در آزمون wilcoxen داده ها در کنار هم و در Mann-whithney داده ها در زیر هم مرتب می ؟ ؟ -)(
-)…(.
-:
>>-
فهرست مطالب