اگر فایل شما دارای یک خط سرصفحه نباشد ، نرم افزار R از اسامی متغیر پیش فرض V1 و V2 , و غیره استفاده خواهد نمود .

به منظور لغو این پیش فرض ، از آرگومان اختیاری read.table یعنی col.names برای تخصیص اسامی متغیر استفاده نمایید .

این آرگومان برداری از اسامی را می پذیرد. بنابراین، اگر فایل ما دارای سرصفحه نبود، می توانستیم از این فرمان استفاده کنیم

 
> fpe = read.table("noheader.dat", 
+ col.names=c("setting","effort","change"))
 

ضمنا ، این اولین دفعه ایست که فرمان ما در یک خط جای نمی گیرد .

با مشخص نمودن این مطلب که کار ما هنوز نیمه تمام است - به عنوان مثال استفاده از یک کاما در انتهای خط یا استفاده از یک پرانتز چپ باز- کد نرم افزار R می تواند به صورت خودکار در یک خط جدید ادامه یابد .

نرم افزار R بوسیله نماد ادامه + به جای پرامپت معمولی > برای پذیرش فرمان های بیشتر اعلام آمادگی می کند .

اگر فایل شما دارای اسامی مشاهدات نباشد ، نرم افزار R مشاهدات را از 1 تا n شماره گذاری خواهد نمود .

شما می توانید اسامی سطر را با استفاده آرگومان اختیاری read.table یعنی row.names که همانند col.names عمل می کند ، مشخص نمایید .

برای کسب اطلاعات بیشتر ، ?data.frame را تایپ نمایید .

دو تابع بسیار مرتبط وجود دارد که می توانند برای تعیین یا تنظیم اسامی متغیر و مشاهدات در آینده مورد استفاده قرار گیرند .

این توابع ، names ( برای اسامی متغیرها ) ، و row.names ( برای اسامی مشاهدات ) نامیده می شوند .

بنابراین ، اگر فایل ما دارای سرصفحه نباشد ، می توانیم داده ها را خوانده و سپس ، اسامی متغیرهای پیش فرض را با استفاده از تابع names تغییر دهیم :

 
> fpe = read.table("noheader.dat")
> names(fpe) = c("setting","effort","change")
 

نکته تخصصی : اگر از دیگر زبان های برنامه نویسی آگاهی داشته باشید ، شاید از دیدن یک فراخوانی تابع در سمت چپ انتساب متعجب گردید .

این ها توابع خاص " جایگزینی " در نرم افزار R می باشند که مولفه ای از یک شی را استخراج نموده و سپس ، مقدار آن را جایگزین می کنند .

در مثال ما ، هر سه متغیر ، عددی بودند . نرم افزار R ، متغیرهای رشته ای را بدون هیچ مشکلی مدیریت خواهد نمود .

اگر یکی از متغیرهای ما جنسیت بود ، و از M بعنوان کدی برای مردان و از F برای زنان استفاده می شد ، نرم افزار R عاملی را ایجاد میکرد که اساسا یک متغیر اسمی بوده و یک مقدار از مجموعه محدود و کران داری از مقادیر را می پذیرد که سطوح نامیده می شوند .

در بخش های بعدی ، از یک چهارچوب داده با متغیرهای اسمی ( categorical ) برای نشان دادن رگرسیون لجستیک استفاده خواهیم نمود .

یکی دیگر از روش های ایجاد عوامل ، گروه بندی با همبسته عددی وابسته است . مثالی در ادامه در بخش بعدی بیان می شود .

تمرین : با استفاده از یک ویرایشگر متن ، فایل کوچکی را با سه خط زیر ایجاد نمایید :

 
a b c
1 2 3
4 5 6
 

این فایل را در نرم افزار R بخوانید ، بنابراین اسامی متغیرها ، a و b و c می باشد . حال ، سطر اول را حذف کرده و مجددا فایل را بخوانید ، بنابراین ، اسامی متغیرها هنوز a و b و c می باشد .

نوشتن دیدگاه


 

آموزش های گام به گام

دومین دوره مسابقات برنامه نویسی دانش آموزی امیرکبیر

دومین دوره مسابقات برنامه نویسی دانش آموزی امیرکبیر

ادامه مطلب...

چهارمین کارگاه ارتباطات و نظریه اطلاعات برگزار می شود

چهارمین کارگاه ارتباطات و نظریه اطلاعات
چهارمین کارگاه ارتباطات و نظریه اطلاعات

ادامه مطلب...

چهارمین کارگاه ارتباطات و نظریه اطلاعات برگزار می شود

چهارمین کارگاه ارتباطات و نظریه اطلاعات
چهارمین کارگاه ارتباطات و نظریه اطلاعات

ادامه مطلب...

سمینار پردازش زبان طبیعی

سمینار پردازش زبان طبیعی
سمینار پردازش زبان طبیعی

ادامه مطلب...