ورقة الغش R: يجب أن تبقيها في متناول اليد

نشرت: 2020-05-29

جدول المحتويات

مقدمة

نمت حالة لغة البرمجة R من كونها مجرد لغة برمجة مصممة للتحليل الإحصائي إلى أداة شاملة أكثر فاعلية. نمت قاعدة مستخدمي R أيضًا خلال السنوات القليلة الماضية. يتم توظيفه الآن من قبل مجموعة من المبرمجين والعلماء والممارسين. من أجل تحقيق أقصى استفادة من أي لغة برمجة ، يعد تعلم كيفية الحصول على المساعدة أمرًا جوهريًا لأن الأخطاء لا بد أن تحدث.

لذلك ، مع معرفة بناء الجملة ، فإن المعرفة حول كيفية الوصول إلى ملفات المساعدة R والعثور على المساعدة من مصادر أخرى أمر بالغ الأهمية للنجاح كمبرمج R. الآن ، هنا حيث ستكون ورقة الغش R مفيدة. تحتوي ورقة الغش R على جميع الوظائف الحيوية جنبًا إلى جنب مع دعواتها لإشارة سهلة للمبرمجين.

تعرف على المزيد: برنامج R التعليمي للمبتدئين: كن خبيرًا في برمجة R

الحصول على مساعدة بشأن لغة البرمجة R

حتى أفضل الكتب لتعريف الناس وتسهيل طريقهم إلى عالم البرمجة بلغة R ليست كافية لوحدها. يحتاج المرء أحيانًا إلى تعلم ملفات المساعدة R والوصول إليها. يقدم ملف المساعدة هذا الذي ما زلنا نتحدث عنه مع جزء من المعلومات التفصيلية للمستخدم حول كيفية استخدام التبعيات المختلفة في R. كيفية الاستفادة من وظيفة معينة ، حيث يتم تخزين كل وظيفة مضمنة في ملفات المساعدة هذه. توجد أيضًا أمثلة التعليمات البرمجية حول كيفية استخدام الوظيفة المحددة في كل صفحة من صفحات المساعدة المختلفة هذه.

إذا كنت ترغب في الوصول إلى ملفات المساعدة R ، للحصول على مساعدة حول كيفية استخدام ميزة معينة ، فسيتعين عليك استخدام أي من الوظائف المدرجة أدناه:

1.؟: يؤدي استخدام علامة استفهام واحدة إلى عرض ملفات المساعدة المتعلقة بأي وظيفة يرغب المستخدم في الحصول عليها. على سبيل المثال ، قد يعرض "؟ data.frame" الصفحة الموجودة في ملفات المساعدة R التي تحتوي على وثائق حول كيفية استخدام وظيفة data.frame ().

2. ؟؟: إذا كنت تريد البحث عن سلسلة فرعية معينة في ملفات المساعدة R ، "؟؟" سوف يقوم بالعمل نيابة عنك. لذا ، إذا كنت تريد معرفة أسماء الوظيفة التي تحتوي على كلمة "list" فيها ، فكل ما عليك فعله هو تشغيل "؟؟ list" وسيتم حل مشكلتك

3. RSiteSearch (): تقوم هذه الوظيفة RSiteSearch () أساسًا بما سُميت باسمه. يقوم بشكل أساسي ببحث عبر الإنترنت حول الاستعلام الذي تم تمريره كمعامل لهذه الوظيفة. لذلك ، فإن RSiteSearch ("النماذج الخطية") ستجمع البحث على موقع الويب "RSiteSearch" للسلسلة "النماذج الخطية".

إذا كنت تكافح من أجل الحصول على مساعدة لـ R ولم تكن المستندات المخبوزة جيدة معك ، فهناك العديد من الحزم الإضافية التي يمكنك تثبيتها للحصول على كل المساعدة التي تحتاجها مع R. الحزم مثل "sos" متاح للتنزيل والذي يقدمه CRAN. تحتوي حزمة R هذه على بعض الوظائف الواضحة والموجزة التي من شأنها أن تجعل البحث عن جميع أنواع الاستعلامات من خلال جميع ملفات المساعدة المتاحة على موقع الويب "RSiteSearch".

كما أن تركيب الحزمة سهل بشكل معقول. كل ما عليك القيام به هو تشغيل حزمة install.packages ("sos") في وحدة التحكم R ، ثم كل ما تبقى هو تحميل الحزمة. يمكن تحميل الحزمة من خلال استخدام المكتبة ("sos").

بعد تثبيت حزمة "sos" ، سيكون بإمكانك الآن الوصول إلى الوظيفة المسماة findFn (). تأخذ وظيفة findFn () هذه معلمة البحث كوسيطة ثم تقوم بإرجاع قائمة المئات من صفحات الويب ، والتي تحتوي على الوسيطة التي تم تمريرها. لذلك ، على سبيل المثال ، إذا قمت بتشغيل وظيفة findFn ("الانحدار") في وحدة التحكم R الخاصة بك ، فستواجه صفحة ويب تحتوي على الكثير من المعلومات.

تتضمن المعلومات روابط للعديد من الوظائف التي تحتوي على كلمة الانحدار في الاسم ، أو حتى إذا كانت تحتوي على عبارة انحدار في نص المساعدة ، فستجد أيضًا مرجعًا لها إذا كنت تستخدم الوظيفة findFn ().

قراءة: 6 أفكار مشروع R مثيرة للاهتمام للمبتدئين

كيفية استيراد البيانات إلى R.

الجدول التالي مفيد لأنه يحتوي على بعض الوظائف التي ستكون مفيدة للغاية عندما تريد استيراد البيانات إلى R:

دور ماذا يفعل مثال
read.table () هذه الوظيفة مسؤولة عن قراءة البيانات التي لم يتم ربط أعمدتها معًا. عادة ، يتم استخدام هذه الوظيفة عندما يتم فصل أعمدتها عن البيانات التي تريد قراءتها بفاصلة أو علامة تبويب. شيء واحد يجب ملاحظته هو أنه يمكنك تحديد الفاصل بنفسك جنبًا إلى جنب مع بعض الحجج المختلفة الأخرى التي تصف بدقة البيانات التي تريد أن تقرأها R. read.table (ملف = " ملفي " ، sep = " t" ،
header = FALSE)
read.csv () هذه الوظيفة بالمصطلحات الخام هي نسخة مخففة جدًا أو مخففة من طريقة read.table (). تم ترميز هذه الوظيفة بشكل ثابت لقراءة البيانات من أي ملف CSV يتم تمريره إلى هذه الوظيفة كوسيطة. عادةً ما تكون ملفات CSV عبارة عن جداول بيانات ووثائق MS Excel. read.csv (ملف = " ملفي ")
read.csv2 () هذه الوظيفة هي في الأساس وظيفة read.csv () مع تعديلات طفيفة. تحتوي وظيفة Read.csv2 () على إعداد مسبق حيث يكون فاصل البيانات عبارة عن فاصلة منقوطة وتكون الفاصلة بمثابة الفاصلة العائمة أو الفاصلة العشرية. read.csv2 (ملف = " ملفي " ،
header = FALSE)
read.delim () يتم استخدام هذه الوظيفة عندما يكون الدافع الرئيسي هو قراءة الملفات التي تم تحديدها. الفاصل الافتراضي الذي يتم استخدامه هنا هو علامة التبويب. read.delim (file = myfile” ،
header = TRUE)
مسح () تمنحك هذه الوظيفة تحكمًا أدق وأكثر دقة في البيانات التي تريد أن تقرأها R إذا كانت البيانات المعنية غير مجدولة. مسح ("ملفي" ، تخطي = 1 ،
nmax = 10)
readLines () تُستخدم هذه الوظيفة عند قراءة سطر واحد في كل مرة من ملف نصي وهي الوظيفة المطلوبة التي نريد أن يؤديها البرنامج. readLines ("ملفي")
read.fwf إذا كانت البيانات التي لديك تحتوي على تواريخ بتنسيق ثابت العرض ، فيجب عليك استخدام هذه الوظيفة لأنها تقرأ التواريخ بتنسيق ثابت العرض. بكلمات أبسط ، إذا كانت البيانات التي لديك تحتوي على عدد ثابت من الأحرف في كل عمود ، فيجب استخدام هذه الوظيفة. read.fwf ("ملفي"،
العروض = ج (1،2،3)

مضيف الوظيفة التي ستتمكن من الوصول إليها بعد تشغيل هذا السطر من التعليمات البرمجية والغرض الذي تخدمه مذكور أدناه:

دور ماذا يفعل مثال
read.spss تأخذ هذه الوظيفة اسم ملف SPSS كوسيطة وتقرأه في برنامج R. read.spss ("ملفي")
read.dta تأخذ هذه الوظيفة إدخال اسم الملف بتنسيق Stata الثنائي وتقرأه في برنامج R. read.dta ("ملفي")
read.xport تأخذ هذه الوظيفة وسيطة اسم ملف تصدير SAS وتقرأ الملف في برنامج R. read.export ("ملفي")

مصدر

تحقق أيضًا من: لماذا تعلم R؟ أهم 8 أسباب لتعلم R.

أنواع البيانات المختلفة والمعالجة الأساسية للجداول

1. هناك ثلاثة أنواع أساسية من البيانات ذات أهمية كبيرة عندما تقوم بالبرمجة في R. هذه الأنواع الثلاثة هي: رقمية ، وحرف ، وعامل. يمكنك إجراء بحث سريعًا عن نوع البيانات هذا ، أو يمكنك أيضًا الكتابة باستخدام الأمرين التاليين ، على التوالي ، is.factor () و as.factor ().

2. إذا قمت باستيراد جدول تحتوي متغيراته على إدخال واحد أو أكثر ، وهي أحرف ، فسوف يقوم R تلقائيًا بإلقاء الجدول على أنه نوع بيانات العامل. ومع ذلك ، يقال أنه لا يزال بإمكانك تحويل البيانات إلى رقمية عن طريق فرض R ، باستخدام الأمر = as.numeric (as.character (dat1 $ VAR1)).

3. أسماء الأوامر (dat1) = c (“ID” ، “X” ، “Y” ، “Z”) في الواقع تعيد تسمية المتغير في مجموعة البيانات الخاصة بك. يجب أن تضع في اعتبارك ويجب أن يتطابق طول المتجه مع عدد المتغيرات التي لديك ؛ خلاف ذلك ، سوف تواجه خطأ.

4. يفتح الأمر fix (dat2) البيانات الكاملة الموجودة لديك في مستند جدول بيانات حيث يمكنك تحرير الخلايا بنقرة مزدوجة بسيطة في الخلايا.

5. إذا كانت البيانات التي لديك تحتوي فقط على قيم رقمية في الجدول ، يمكنك أن تأخذ تبديل الجدول. استخدم ، dat2 = t (dat1) ، وسيحتوي الجدول المسمى dat2 على تبديل (تحويل جميع الصفوف إلى أعمدة) لجدول البيانات الموجود في dat1.

تلميحات حول كيفية إنشاء بيانات عشوائية وكيفية أخذ العينات العشوائية

1. تأخذ الدالة rnorm (10) الوسيطة 10 وتقوم بإنشاء عشر عينات عشوائية. يتم إنشاء هذه العينات العشوائية من التوزيع الطبيعي ، الذي له متوسط ​​صفري ، والانحراف المعياري لمجموعة البيانات هو 1.

2. تأخذ الدالة runif (10) عشر عينات عشوائية مختلفة لإنشاء توزيع موحد وقيمته بين صفر وواحد.

3. تأخذ جولة الدالة (rnorm (10) * 3 + 15) عشر عينات ، وهي عشوائية من التوزيع الطبيعي بمتوسط ​​15 ، والانحراف المعياري لها هو 3 والنقاط العائمة الموجودة في تتم إزالة البيانات بمساعدة وظيفة التقريب.

4. دالة الجولة (runif (10) * 5 + 15) تعيد المستخدم بأعداد صحيحة عشوائية ، والتي لها قيمة بين القيمتين 15 و 20. وسيكون توزيع هذه القيم منتظمًا.

5. عينة الوظيفة (ج ("أ" ، "ب" ، "ج") ، 10 ، استبدل = TRUE) عينات وإنشاء عينة عشوائية من أي متجه تم تمريره كوسيطة لهذه الوظيفة.

تعلم دورات علوم البيانات من أفضل الجامعات في العالم. اربح برامج PG التنفيذية أو برامج الشهادات المتقدمة أو برامج الماجستير لتتبع حياتك المهنية بشكل سريع.

تلميحات حول كيفية تحويل البيانات الموجودة داخل جدول البيانات

1. استدعاء الوظيفة لوظيفة التحويل التي يتم إجراؤها مثل dat2 = التحويل (dat1، VAR1 = VAR1 * 0.4) ، يضاعف القيم المخزنة في VAR1 مع 0،4 ثم يعيد تعيين القيمة المضاعفة إلى VAR1 مرة أخرى.

2. يمكن أيضًا استخدام استدعاء تحويل الوظيفة لإنشاء متغيرات ذات تبعيات محددة على المتغيرات الحالية. إذا قمت باستدعاء الدالة مثل هذه dat2 = تحويل (dat1، VAR2 = VAR1 * 2) ، فسيتم إنشاء متغير جديد باسم VAR2 ، والذي سيحتوي على قيمة VAR1 مضروبة بعامل اثنين.

3. يمكنك أيضًا استدعاء وظيفة التحويل لتعديل القيم في أي موقع محدد تريده. لأداء هذه المهمة ، سيتعين عليك استدعاء الوظيفة مثل dat2 = تحويل (dat1 ، VAR1 = ifelse (VAR3 == "الموقع 1" ، VAR1 * 0.4 ، VAR1)). الاستدعاء ، كما ذكرنا سابقًا لوظيفة التحويل ، يضاعف البيانات المخزنة في VAR1 لإدخالات البيانات ، وهي المكان المعروف باسم الموقع 1. تظل قيمة المتغير VAR1 كما هي في أي مكان آخر.

قراءة: 8 مشاريع مذهلة في علوم البيانات في R للمبتدئين

خاتمة

شهد عالم البرمجة ازدهارًا في اللغات على مدار السنوات القليلة الماضية. تهدف لغات البرمجة هذه إلى استئصال وتركيز اهتمامها على جانب واحد من جوانب الحوسبة. تتميز اللغات مثل R بنهج إحصائي قوي يركز على علوم البيانات ويرجع ذلك أساسًا إلى الميزات المخبوزة التي تمتلكها هذه اللغة.

أثناء العمل في أي لغة برمجة ، فإن وجود كل أمر في متناول يدك ليس بالمهمة السهلة. الآن ، هذا هو المكان الذي تأتي فيه ورقة الغش R للإنقاذ. شيء واحد يجب تذكره دائمًا هو أن أفضل ورقة غش على شكل حرف R هي الورقة التي تقوم بإنشائها.

ما معنى C في لغة البرمجة R؟

تشير وظيفة C إلى "Combine" في لغة البرمجة R. يتم استخدام هذه الوظيفة للحصول على الإخراج عن طريق تمرير المعلمات في الوظيفة. يمكنك استخراج البيانات بثلاث طرق مختلفة باستخدام C في R: باستخدام الأمر c (row) لاستخراج الصفوف ، وأمر c (عمود) لاستخراج الأعمدة ، وأمر c (صف ، عمود) لاستخراج كلا العمودين والصفوف.

هنا ، يجب عليك تقديم قيمة الصفوف والأعمدة في الوظيفة من مجموعة البيانات التي تستخدمها. ستعيد الوظيفة متجهًا في العودة إلى هذا الأمر. بخلاف ذلك ، يمكنك استخدام الدالة c () للجمع بين متجهين مختلفين.

ما هي وظائف R؟

الوظائف عبارة عن وحدات نمطية من التعليمات البرمجية قائمة بذاتها تُستخدم لأداء مهمة محددة. عادةً ما تأخذ الوظائف بنية بيانات معينة مثل القيمة أو إطار البيانات أو المتجه أو أي شيء وتعالجها لإرجاع نتيجة. يتم تمرير الوسيطات في هذه الوظائف بين قوسين لتحديد المتطلبات.

هناك نوعان من الوظائف المستخدمة في R: الأساسية والمعرفة من قبل المستخدم. الوظائف الأساسية هي تلك المتوفرة بالفعل في لغة البرمجة R. يمكنك الوصول إلى هذه الوظائف من مختلف الحزم أو المكتبات المتوفرة في R. يتم استخدام كل وظيفة لغرض مختلف ولإكمال مهمة معينة. بعض الوظائف الأساسية في R هي sqrt () ، round () ، getwd () ، إلخ. نظرًا لأنه لا يمكن إكمال كل إجراء بمساعدة الوظائف الأساسية ، فأنت بحاجة إلى الحصول على مساعدة من الوظائف التي يحددها المستخدم عن طريق كتابة التعليمات البرمجية الخاصة بك لأداء بعض المهام المخصصة. يتم تطوير هذه الوظائف عندما يتعين عليك القيام بإجراءات معينة عدة مرات. وظيفة يمكن أن تجعل هذا أسهل بالنسبة لك.

ما هي بعض الميزات الرئيسية للغة البرمجة R؟

هناك العديد من الطرق التي يمكن أن تساعد بها R محللي البيانات وعلماء البيانات. تساعده بعض ميزاته الرئيسية في التميز عن الحشد العام للغات الإحصائية. الميزات الرئيسية هي القدرات الرسومية القوية ، والقدرة على إجراء عمليات حسابية إحصائية معقدة ، وتشغيل التعليمات البرمجية دون الحاجة إلى أي مترجم ، ومناقشة البيانات ، ومعالجة البيانات ، وقدرات التخزين ، والقدرة على إنشاء تقارير بالتنسيقات المرغوبة.