ساختار داده ی مهمی که تاکنون در مورد آن صحبت نکرده ایم List می باشد .

لیست ، مجموعه ای از اشیائ است که معمولا نامگذاری شده و می توانند هرچیزی از قبیل اعداد ، رشته های کاراکتری ، ماتریس ها یا حتی لیست ها باشند .

بر خلاف یک بردار ، که تمام مولفه های آن باید از یک نوع ( تماما عددی ، یا تماما کاراکتری ) باشند ، مولفه های یک لیست ممکن است انواع مختلفی داشته باشند .

در اینجا لیستی با دو مولفه ارائه می گردد که با استفاده از تابع list ایجاد شده است :

 
> person = list(name="Jane", age=24)
 

با تایپ نمودن نام لیست ، تمام مولفه ها پرینت می شود . شما می توانید با استفاده از عملگر استخراج $ ، مولفه ای از یک لیست را استخراج نمایید .

به عنوان مثال ، می توان صرفا نام یا سن این شخص را لیست نمود :

 
> person$name
[1] "Jane"
> person$age
[1] 24
 

هر یک از مولفه های یک لیست نیز با استفاده از شاخص ها یا اسامی آن ها به عنوان زیرنویس قابل دسترس می باشند . به عنوان مثال ، می توانیم با استفاده از person[1] یا

person["name"] به نام دست پیدا کنیم .

( شما می توانید براساس نیاز خود - یعنی داشتن لیستی شامل نام که همان چیزیست که ما انجام دادیم ، یا صرفا دستیابی به نام که به دو کروشه همانند person[[1]] یا

person[["name"]] نیاز دارد - از یک یا دو کروشه استفاده نمایید . تمایز در این مرحله ، حائز اهمیت نمی باشد . )

یک چهارچوب داده data frame اساسا یک آرایه مستطیلی شامل مقادیر یک یا چند متغیر برای مجموعه ای از واحدها می باشد .

این چهارچوب همچنین شامل اسامی متغیرها ، اسامی مشاهدات و اطلاعات مربوط به ماهیت متغیرها ، از جمله عددی ( numeric ) یا اسمی ( categorical ) بودن آن ها می باشد .

در پیاده سازی داخلی ، یک چهارچوب داده ، نوع خاصی از لیست می باشد که هر مولفه در آن ، برداری از مشاهدات بر روی یک متغیر است .

چهارچوب های داده شبیه ماتریس ها هستند ، اما می توانند ستون های با تایپ های مختلفی داشته باشند .

این امر ، آنها را بطور ایده آل به گزینه ای مناسب برای بیان کردن مجموعه داده هایی تبدیل می نماید که در آن ، برخی از متغیرها عددی و بقیه اسمی ( categorical ) باشند .

چهارچوب های داده ( همانند ماتریس ها ) همچنین می توانند مقادیر مفقودی را که با استفاده از نماد خاص NA کدگذاری شده اند ، داشته باشند .

باوجود این ، اکثر روش های آماری ، تمام مقادیر مفقود را صرف نظر می کنند .

چهارچوب های داده را می توان با استفاده از تابع data.frame از بردارها ، ماتریس ها یا لیست ها ایجاد نمود ، اما همانطور که در دو بخش بعدی نشان داده شده است ، غالبا داده ها از یک فایل خارجی خوانده می شوند .

نوشتن دیدگاه


تصویر امنیتی
تصویر امنیتی جدید

 

آموزش های گام به گام

سمینار پردازش زبان طبیعی

سمینار پردازش زبان طبیعی
سمینار پردازش زبان طبیعی

ادامه مطلب...

دومین دوره مسابقات برنامه نویسی دانش آموزی امیرکبیر

دومین دوره مسابقات برنامه نویسی دانش آموزی امیرکبیر

ادامه مطلب...

سمینار خانه های هوشمند برای دوران پیری

سمینار خانه های هوشمند برای دوران پیری

ادامه مطلب...

سمینار پردازش زبان طبیعی

سمینار پردازش زبان طبیعی
سمینار پردازش زبان طبیعی

ادامه مطلب...