اگر فایل شما دارای یک خط سرصفحه نباشد ، نرم افزار R از اسامی متغیر پیش فرض V1 و V2 , و غیره استفاده خواهد نمود .

به منظور لغو این پیش فرض ، از آرگومان اختیاری read.table یعنی col.names برای تخصیص اسامی متغیر استفاده نمایید .

این آرگومان برداری از اسامی را می پذیرد. بنابراین، اگر فایل ما دارای سرصفحه نبود، می توانستیم از این فرمان استفاده کنیم

 
> fpe = read.table("noheader.dat", 
+ col.names=c("setting","effort","change"))
 

ضمنا ، این اولین دفعه ایست که فرمان ما در یک خط جای نمی گیرد .

با مشخص نمودن این مطلب که کار ما هنوز نیمه تمام است - به عنوان مثال استفاده از یک کاما در انتهای خط یا استفاده از یک پرانتز چپ باز- کد نرم افزار R می تواند به صورت خودکار در یک خط جدید ادامه یابد .

نرم افزار R بوسیله نماد ادامه + به جای پرامپت معمولی > برای پذیرش فرمان های بیشتر اعلام آمادگی می کند .

اگر فایل شما دارای اسامی مشاهدات نباشد ، نرم افزار R مشاهدات را از 1 تا n شماره گذاری خواهد نمود .

شما می توانید اسامی سطر را با استفاده آرگومان اختیاری read.table یعنی row.names که همانند col.names عمل می کند ، مشخص نمایید .

برای کسب اطلاعات بیشتر ، ?data.frame را تایپ نمایید .

دو تابع بسیار مرتبط وجود دارد که می توانند برای تعیین یا تنظیم اسامی متغیر و مشاهدات در آینده مورد استفاده قرار گیرند .

این توابع ، names ( برای اسامی متغیرها ) ، و row.names ( برای اسامی مشاهدات ) نامیده می شوند .

بنابراین ، اگر فایل ما دارای سرصفحه نباشد ، می توانیم داده ها را خوانده و سپس ، اسامی متغیرهای پیش فرض را با استفاده از تابع names تغییر دهیم :

 
> fpe = read.table("noheader.dat")
> names(fpe) = c("setting","effort","change")
 

نکته تخصصی : اگر از دیگر زبان های برنامه نویسی آگاهی داشته باشید ، شاید از دیدن یک فراخوانی تابع در سمت چپ انتساب متعجب گردید .

این ها توابع خاص " جایگزینی " در نرم افزار R می باشند که مولفه ای از یک شی را استخراج نموده و سپس ، مقدار آن را جایگزین می کنند .

در مثال ما ، هر سه متغیر ، عددی بودند . نرم افزار R ، متغیرهای رشته ای را بدون هیچ مشکلی مدیریت خواهد نمود .

اگر یکی از متغیرهای ما جنسیت بود ، و از M بعنوان کدی برای مردان و از F برای زنان استفاده می شد ، نرم افزار R عاملی را ایجاد میکرد که اساسا یک متغیر اسمی بوده و یک مقدار از مجموعه محدود و کران داری از مقادیر را می پذیرد که سطوح نامیده می شوند .

در بخش های بعدی ، از یک چهارچوب داده با متغیرهای اسمی ( categorical ) برای نشان دادن رگرسیون لجستیک استفاده خواهیم نمود .

یکی دیگر از روش های ایجاد عوامل ، گروه بندی با همبسته عددی وابسته است . مثالی در ادامه در بخش بعدی بیان می شود .

تمرین : با استفاده از یک ویرایشگر متن ، فایل کوچکی را با سه خط زیر ایجاد نمایید :

 
a b c
1 2 3
4 5 6
 

این فایل را در نرم افزار R بخوانید ، بنابراین اسامی متغیرها ، a و b و c می باشد . حال ، سطر اول را حذف کرده و مجددا فایل را بخوانید ، بنابراین ، اسامی متغیرها هنوز a و b و c می باشد .

نوشتن دیدگاه


 

آموزش های گام به گام

سمینار خانه های هوشمند برای دوران پیری

سمینار خانه های هوشمند برای دوران پیری

ادامه مطلب...

سمینار خانه های هوشمند برای دوران پیری

سمینار خانه های هوشمند برای دوران پیری

ادامه مطلب...

مسابقه حل مسائل مهندسی شیمی به کمک کامپیوتر دانشگاه صنعتی شریف

مسابقه حل مسائل مهندسی شیمی به کمک کامپیوتر دانشگاه صنعتی شریف
مسابقه حل مسائل مهندسی شیمی به کمک کامپیوتر دانشگاه صنعتی شریف

ادامه مطلب...

دومین دوره مسابقات برنامه نویسی دانش آموزی امیرکبیر

دومین دوره مسابقات برنامه نویسی دانش آموزی امیرکبیر

ادامه مطلب...