مقالات

4.7: ملاءمة النماذج الأسية للبيانات


في القسم السابق ، رأينا خطوط الأعداد باستخدام المقاييس اللوغاريتمية. من الشائع أيضًا رؤية رسوم بيانية ثنائية الأبعاد ذات محورين أو كلاهما باستخدام مقياس لوغاريتمي.

أحد الاستخدامات الشائعة للمقياس اللوغاريتمي على المحور الرأسي هو رسم الكميات التي تتغير أسيًا ، لأنها تساعد في الكشف عن الاختلافات النسبية. يظهر كلا مخططي الأسهم أدناه متوسط ​​داو جونز الصناعي ، من عام 1928 إلى عام 2010.

كلا المخططين لهما مقياس أفقي خطي ، لكن الرسم البياني الأول له مقياس رأسي خطي ، بينما يحتوي الرسم البياني الثاني على مقياس رأسي لوغاريتمي. المقياس الأول هو المقياس الذي نعرفه أكثر ، ويظهر ما يبدو أنه اتجاه أسي قوي ، على الأقل حتى عام 2000.

مثال ( PageIndex {1} )

شهد سوق الأسهم انخفاضًا في عامي 1929 و 2008. أيهما كان أكبر؟

المحلول

في الرسم البياني الأول ، يبدو انخفاض سوق الأسهم في حوالي عام 2008 كبيرًا جدًا ، ومن حيث قيم الدولار ، فقد كان بالفعل انخفاضًا كبيرًا. ومع ذلك ، يُظهر الرسم البياني الثاني تغيرات نسبية ، ويبدو الانخفاض في عام 2009 أقل أهمية على هذا الرسم البياني ، وفي الواقع ، كان الانخفاض الذي بدأ في عام 1929 ، من حيث النسبة المئوية ، أكثر أهمية.

على وجه التحديد ، في عام 2008 ، انخفضت قيمة داو جونز من حوالي 14000 إلى 8000 ، أي بانخفاض قدره 6000. من الواضح أن هذا يمثل انخفاضًا كبيرًا في القيمة ، ويصل إلى حوالي 43٪. في عام 1929 ، انخفضت قيمة مؤشر داو جونز من أعلى مستوى عند حوالي 380 إلى أدنى مستوى عند 42 بحلول يوليو من عام 1932. في حين أن هذا الانخفاض البالغ 338 من حيث القيمة هو أصغر بكثير من انخفاض عام 2008 ، فإنه يتوافق مع انخفاض بنسبة 89٪ ، وهو أكبر بكثير انخفاض نسبي مقارنة بعام 2008. يوضح المقياس اللوغاريتمي هذه التغييرات النسبية.

الرسم البياني الثاني أعلاه ، حيث يستخدم أحد المحاور مقياسًا خطيًا ويستخدم المحور الآخر مقياسًا لوغاريتميًا ، هو مثال على شبه سجل رسم بياني.

التعريف: رسوم بيانية نصف لوغاريتمية وتسجيلية

أ شبه سجل الرسم البياني هو رسم بياني بمحور واحد باستخدام مقياس خطي ومحور واحد باستخدام مقياس لوغاريتمي.

أ سجل الدخول الرسم البياني هو رسم بياني لكلا المحورين باستخدام المقاييس اللوغاريتمية.

مثال ( PageIndex {2} )

ارسم 5 نقاط على الرسم البياني (f (x) = 3 (2) ^ {x} ) على رسم بياني نصف لوغاريتمي بمقياس لوغاريتمي على المحور الرأسي.

المحلول

للقيام بذلك ، علينا إيجاد 5 نقاط على الرسم البياني ، ثم حساب اللوغاريتم لقيمة المخرجات. اختيار 5 قيم إدخال بشكل تعسفي ،

(س ) (و (س) )تسجيل الدخول ( (و (س) ))
-3 (3 (2) ^ {- 1} = dfrac {3} {8} )-0.426
-1 (3 (2) ^ {- 1} = dfrac {3} {2} )0.176
0(3(2)^{0} = 3)0.477
2(3(2)^{2} = 12)1.079
5(3(2)^{5} = 96)1.982

رسم هذه القيم على رسم بياني نصف سجل ،

لاحظ أنه في هذا المقياس شبه اللوغاريتمي ، تظهر القيم من الدالة الأسية خطية. يمكننا إظهار أن هذا السلوك متوقع من خلال استخدام الخصائص اللوغاريتمية. بالنسبة للوظيفة (f (x) = ab ^ {x} ) ، فإن العثور على السجل ( (f (x) )) يعطي

[ log left (f (x) right) = log left (ab ^ {x} right) nonumber ] باستخدام خاصية مجموع السجلات ،
[ log left (f (x) right) = log left (a right) + log left (b ^ {x} right) nonumber ] الآن باستخدام خاصية الأس ،
[ سجل يسار (و (س) يمين) = سجل يسار (أ يمين) + س سجل يسار (ب يمين) غير رقم ]

هذه العلاقة خطية ، مع تسجيل (أ) مثل التقاطع الرأسي ، وتسجيل (ب) كمنحدر. يمكن أيضًا استخدام هذه العلاقة في الاتجاه المعاكس.

مثال ( PageIndex {3} )

يتم رسم الرسم البياني الأسي على محاور شبه لوغاريتمية. ابحث عن صيغة للدالة الأسية (g (x) ) التي أنشأت هذا الرسم البياني.

المحلول

الرسم البياني خطي ، مع تقاطع رأسي عند (0 ، 1). بالنظر إلى التغيير بين النقطتين (0 ، 1) و (4 ، 4) ، يمكننا تحديد ميل الخط هو ( dfrac {3} {4} ). نظرًا لأن الإخراج هو السجل ( (g (x) )) ، فإن هذا يؤدي إلى المعادلة ( log left (g (x) right) = 1 + dfrac {3} {4} x ).

يمكننا حل هذه الصيغة من أجل (g (x) ) بإعادة الكتابة بالصيغة الأسية والتبسيط:

[ log left (g (x) right) = 1 + dfrac {3} {4} x nonumber ] إعادة الكتابة على هيئة أسي ،
[g (x) = 10 ^ {1+ dfrac {3} {4} x} nonumber ] كسر هذا باستخدام قواعد الأس ،
[g (x) = 10 ^ {1} cdot 10 ^ { dfrac {3} {4} x} nonumber ] باستخدام قواعد الأس لتجميع العامل الثاني ،
[g (x) = 10 ^ {1} cdot left (10 ^ { dfrac {3} {4}} right) ^ {x} nonumber ] تقييم قوى العدد 10 ،
[g (x) = 10 left (5.623 right) ^ {x} nonumber ]

تمرين ( PageIndex {1} )

يتم رسم رسم بياني أسي على رسم بياني نصف لوغاريتمي أدناه. ابحث عن صيغة للدالة الأسية (g (x) ) التي أنشأت هذا الرسم البياني.

إجابه

[g (x) = 10 ^ {2 - 0.5x} = 10 ^ 2 (10 ^ {- 0.5}) ^ {x}، quad f (x) = 100 (0.3162) ^ x nonumber ]

تركيب الدوال الأسية ل بيانات

توفر بعض خيارات التكنولوجيا وظائف مخصصة للعثور على الوظائف الأسية التي تناسب البيانات ، لكن العديد منها يوفر فقط وظائف لتناسب الوظائف الخطية على البيانات. يوفر لنا المقياس شبه اللوغاريتمي طريقة لتلائم وظيفة أسية للبيانات من خلال البناء على التقنيات التي لدينا لتركيب الوظائف الخطية على البيانات.

لتلائم دالة أسية لمجموعة من البيانات باستخدام الخطية

  1. ابحث عن سجل قيم إخراج البيانات
  2. أوجد المعادلة الخطية التي تناسب أزواج (المدخلات ، السجل (المخرجات)). ستكون هذه المعادلة على شكل سجل ( (f (x) )) = (b + mx ).
  3. حل هذه المعادلة للدالة الأسية (f (x) )

مثال ( PageIndex {4} )

يوضح الجدول أدناه التكلفة بالدولار لكل ميغا بايت من مساحة التخزين على محركات الأقراص الصلبة للكمبيوتر من 1980 إلى 2004 ، وتظهر البيانات على رسم بياني قياسي إلى اليمين ، مع تغيير المدخلات إلى سنوات بعد 1980.

يبدو أن هذه البيانات تتناقص بشكل كبير. لإيجاد دالة تمثل هذا الانحلال ، سنبدأ بإيجاد لوغاريتم التكاليف.

المحلول

كما هو مأمول ، يبدو الرسم البياني لسجل التكاليف خطيًا إلى حد ما ، مما يشير إلى أن الدالة الأسية ستناسب البيانات الأصلية بشكل معقول. باستخدام التكنولوجيا ، يمكننا إيجاد معادلة خطية تناسب قيم السجل (التكلفة). باستخدام (t ) كسنوات بعد 1980 ، يعطي الانحدار الخطي المعادلة:

[ log (C (t)) = 2.794-0.231t nonumber ]

حل من أجل (C (t) ) ،

[C (t) = 10 ^ {2.794-0.231t} nonumber ]
[C (t) = 10 ^ {2.794} cdot 10 ^ {- 0.231t} nonumber ]
[C (t) = 10 ^ {2.794} cdot left (10 ^ {- 0.231} right) ^ {t} nonumber ]
[C (t) = 622 cdot left (0.5877 right) ^ {t} nonumber ]

تشير هذه المعادلة إلى أن تكلفة كل ميغا بايت للتخزين على محركات الأقراص الصلبة للكمبيوتر تتناقص بنحو 41٪ كل عام.

باستخدام هذه الوظيفة ، يمكننا التنبؤ بتكلفة التخزين في المستقبل. توقع التكلفة في عام 2020 ( (t = 40 )):

(C (40) = 622 يسار (0.5877 يمين) ^ {40} تقريبًا 0.000000364 ) دولار لكل ميغا بايت ، وهو رقم صغير حقًا. وهذا يعادل 0.36 دولار لكل تيرابايت من مساحة تخزين القرص الصلب.

بمقارنة القيم التي تنبأ بها هذا النموذج بالبيانات الفعلية ، نرى أن النموذج يطابق البيانات الأصلية بترتيب الحجم ، لكن القيم المحددة تبدو مختلفة تمامًا. هذا ، للأسف ، هو أفضل نموذج أسي يمكن أن يناسب البيانات. من الممكن أن يتلاءم النموذج غير الأسي مع البيانات بشكل أفضل ، أو يمكن أن يكون هناك تباين واسع بما فيه الكفاية في البيانات بحيث لا يوجد نموذج بسيط نسبيًا يناسب البيانات بشكل أفضل.

عامالتكلفة الفعلية لكل ميغا بايتالتكلفة المتوقعة حسب النموذج
1980192.31622.3
198487.8674.3
198815.988.9
199241.1
19960.1730.13
20000.0068490.015
20040.0011490.0018

تمرين ( PageIndex {2} )

يوضح الجدول أدناه قيمة (V ) بمليارات الدولارات لواردات الولايات المتحدة من الصين بعد عام 2000.

عام200020012002200320042005
(ر )012345
(الخامس)100102.3125.2152.4196

يبدو أن هذه البيانات تنمو باطراد. ضع هذه البيانات بشكل خطي وقم ببناء نموذج للتنبؤ بعدد المليارات من الدولارات من الواردات المتوقعة في عام 2011.

إجابه

(V (t) = 90.545 (1.2078) ^ t ). توقع عام 2011 (V (11) = 722.45 ) مليار دولار.

موضوعات مهمة في هذا القسم

  • رسم بياني شبه سجل
  • رسم بياني لسجل الدخول
  • الدوال الأسية الخطية
  • ملاءمة المعادلة الأسية للبيانات

بناء نموذج أسي من البيانات

كما تعلمنا ، هناك العديد من المواقف التي يمكن نمذجتها بوظائف أسية ، مثل نمو الاستثمار ، والانحلال الإشعاعي ، وتغيرات الضغط الجوي ، ودرجات حرارة جسم التبريد. ما المشترك بين هذه الظواهر؟ لسبب واحد ، كل النماذج تزداد أو تنقص مع تقدم الوقت. لكن هذه ليست القصة كاملة. انها ال طريق زيادة أو نقص البيانات التي تساعدنا على تحديد ما إذا كان من الأفضل نمذجة المعادلة الأسية. تتيح لنا معرفة سلوك الدوال الأسية بشكل عام التعرف على وقت استخدام الانحدار الأسي ، لذلك دعونا نراجع النمو الأسي والانحطاط.

الانحدار الأسي تُستخدم لنمذجة المواقف التي يبدأ فيها النمو ببطء ثم يتسارع بسرعة دون قيود ، أو حيث يبدأ الاضمحلال بسرعة ثم يتباطأ ليقترب أكثر فأكثر من الصفر. نستخدم الأمر "ExpReg" في أداة الرسم البياني لتلائم دالة أسية لمجموعة من نقاط البيانات. هذا يعيد معادلة بالصيغة y = a b x y = a b x

بالنظر إلى مجموعة من البيانات ، قم بإجراء الانحدار الأسي باستخدام أداة الرسوم البيانية.

  1. استخدم قائمة STAT ثم EDIT لإدخال البيانات المحددة.
    1. امسح أي بيانات موجودة من القوائم.
    2. قائمة بقيم الإدخال في العمود L1.
    3. سرد قيم الإخراج في العمود L2.
    1. استخدم ZOOM [9] لضبط المحاور لتناسب البيانات.
    2. تحقق من البيانات تتبع النمط الأسي.
    1. حدد "ExpReg" من قائمة STAT ثم CALC.
    2. استخدم القيم التي تم إرجاعها لـ أ و ب لتسجيل النموذج ، ص = أ ب س. ص = أ ب س.

    في عام 2007 ، نُشرت دراسة جامعية تبحث في مخاطر الاصطدام الناتج عن القيادة تحت تأثير الكحول. تم استخدام بيانات من 2871 حادثًا لقياس ارتباط مستوى الكحول في دم الشخص (BAC) بخطر التعرض لحادث. يظهر [رابط] نتائج الدراسة 1. ال خطر نسبي هو مقياس لعدد المرات التي يحتمل أن يتعرض فيها الشخص للتحطم. لذلك ، على سبيل المثال ، الشخص الذي لديه BAC 0.09 هو 3.54 مرة أكثر عرضة للتحطم من الشخص الذي لم يشرب الكحول.

    1. باستخدام قائمة STAT ثم EDIT في أداة الرسم البياني ، قم بإدراج قيم BAC في L1 وقيم المخاطر النسبية في L2. ثم استخدم ميزة STATPLOT للتحقق من أن مخطط الانتشار يتبع النمط الأسي الموضح في [الرابط]:

    استخدم الأمر "ExpReg" من قائمة STAT ثم CALC للحصول على النموذج الأسي ،

    التحويل من التدوين العلمي ، لدينا:

    استخدم النموذج لتقدير المخاطر المرتبطة بـ BAC بقيمة 0.16. 0.16. عوّض بـ 0.16 0.16 عن x x في النموذج وحل من أجل y. ذ.

    إذا كان الشخص الذي يبلغ وزنه 160 رطلاً يقود سيارته بعد تناول 6 مشروبات ، فمن المحتمل أن يصطدم بحوالي 26.35 مرة أكثر من القيادة أثناء اليقظة.

    يُظهر [رابط] رصيد بطاقة ائتمان الخريجين الجدد كل شهر بعد التخرج.

    1. استخدم الانحدار الأسي لملاءمة نموذج مع هذه البيانات.
    2. إذا استمر الإنفاق على هذا المعدل ، فما ديون بطاقة ائتمان الخريج بعد عام واحد من تخرجه؟

    هل من المعقول أن نفترض أن نموذج الانحدار الأسي سيمثل حالة إلى أجل غير مسمى؟

    لا ، تذكر أن النماذج يتم تكوينها بواسطة بيانات واقعية تم جمعها من أجل الانحدار. عادة ما يكون من المعقول عمل تقديرات خلال الفترة الزمنية للملاحظة الأصلية (الاستيفاء). ومع ذلك ، عند استخدام نموذج لعمل تنبؤات ، من المهم استخدام مهارات التفكير لتحديد ما إذا كان النموذج منطقيًا للمدخلات التي تتجاوز فترة الملاحظة الأصلية (الاستقراء).


    الحجج

    كائن حدوث ، تم إنشاؤه بواسطة حدوث الوظيفة (). بالنسبة لوظيفة الرسم ، يكون الكائن incidence_fit.

    نقطة زمنية اختيارية تحدد الفصل بين النموذجين. إذا كان NULL ، يتم تركيب نموذج واحد. إذا تم توفير نموذجين ، فسيتم تركيبهما في الفترات الزمنية على جانبي الانقسام.

    فترة الثقة المراد استخدامها للتنبؤات الافتراضية 95٪.

    منطقي يشير إلى ما إذا كان يجب إخفاء التحذيرات من الملاءمة FALSE افتراضيًا. تشير التحذيرات عادةً إلى حدوث بعض الصفر ، والتي تتم إزالتها قبل إجراء الانحدار اللوغاريتمي الخطي.

    الحجم ، بالأيام ، للنافذة الزمنية على جانبي الانقسام.

    منطقي يشير إلى ما إذا كان يجب إضافة قطعة أرض إلى الإخراج (TRUE ، افتراضيًا) ، مع إظهار متوسط ​​R2 للتقسيمات المختلفة.

    إذا كانت المجموعات موجودة ، فهل يجب تحديد تواريخ منفصلة لكل مجموعة؟ افتراضات إلى TRUE ، حيث سيتم إنشاء تواريخ منفصلة وبالتالي ، نماذج منفصلة لكل مجموعة. عند FALSE ، سيتم تحديد تاريخ الانقسام من البيانات المجمعة ونمذجة مع المجموعات كتأثيرات رئيسية وتفاعلات مع التاريخ.


    واجهة التطبيق¶

    تم تصميم PyFlux API ليكون واضحًا ومختصرًا قدر الإمكان ، مما يعني أنه يتطلب أقل عدد من الخطوات لإجراء عملية بناء النموذج. المخطط رفيع المستوى مفصل أدناه.

    الخطوة الأولى هي إنشاء مثيل نموذج، حيث تكون الحجج الرئيسية هي (1) إدخال البيانات ، مثل إطار بيانات الباندا ، (2) معلمات التصميم ، مثل فترات التأخر الذاتي لنموذج ARIMA ، و (3) عائلة تحدد توزيع السلاسل الزمنية المنمذجة ، مثل التوزيع الطبيعي.

    الخطوة الثانية هي التكوين المسبق، والذي يتضمن تحديد عائلة لكل متغير كامن في النموذج باستخدام طريقة Adjust_prior ، على سبيل المثال يمكننا أن نعد سابقًا للثابت في نموذج ARIMA (N left (0،10 right) ). يمكن عرض المتغيرات الكامنة عن طريق طباعة الكائن latent_variables المرفق بالنموذج. يتم تجاهل التكوين المسبق إذا كان المستخدم ينوي القيام فقط بأقصى احتمال.

    الخطوة الثالثة هي تركيب النموذج (أو الاستدلال)، والذي يتضمن استخدام طريقة مناسبة ، وتحديد خيار الاستدلال. تتضمن الخيارات الحالية أقصى احتمال (MLE) ، و Metropolis-Hastings (M-H) ، والاستدلال المتغير للصندوق الأسود (BBVI). بمجرد اكتمالها ، سيتم تحديث معلومات المتغير الكامن للنموذج ، ويمكن للمستخدم المتابعة إلى طرق ملائمة النشر.

    الخطوة الرابعة هي تقييم النموذج, استرجاع و تنبؤ. بمجرد أن يكون النموذج مناسبًا ، يمكن للمستخدم أن ينظر إلى الملاءمة التاريخية ، وانتقاد الفحوصات التنبؤية اللاحقة ، والتنبؤ بالخروج من العينة ، وتنفيذ مجموعة من المهام الأخرى لنموذجهم.


    التوافق الأسي لإجمالي حالات COVID-19 في كاليفورنيا

    تم الحصول على البيانات المتعلقة بجائحة COVID-19 من الموقع الرسمي "لمراكز السيطرة على الأمراض والوقاية منها" (https://data.cdc.gov/Case-Surveillance/United-States-COVID-19-Cases- and-Deaths-by-State-o / 9mfq-cb36) وتم تنزيله كملف csv. أول شيء يجب فعله هو استيراد البيانات إلى إطار بيانات Pandas. للقيام بذلك ، تعمل Pandas pandas.read_csv () و pandas.Dataframe () كانوا يعملون. يتكون إطار البيانات الذي تم إنشاؤه من 15 عمودًا ، من بينها يمكننا العثور على تاريخ الإرسال والحالة وإجمالي الحالات والحالات المؤكدة وغيرها من الملاحظات ذات الصلة. للحصول على نظرة ثاقبة للترتيب الذي يتم عرض هذه الفئات به ، نقوم بطباعة رأس إطار البيانات كما يمكن ملاحظته ، يتم سرد إجمالي الحالات تحت الصوت "tot_cases".

    نظرًا لأننا في هذه المقالة مهتمون فقط بالبيانات المتعلقة بولاية كاليفورنيا ، فإننا نقوم بإنشاء إطار بيانات فرعي يحتوي فقط على المعلومات المتعلقة بولاية كاليفورنيا. للقيام بذلك ، نستغل إمكانات Pandas في فهرسة الأقسام الفرعية لإطار البيانات. سيطلق على إطار البيانات هذا اسم df_CA (من كاليفورنيا) ويحتوي على جميع عناصر إطار البيانات الرئيسي الذي يكون عمود "الولاية" فيه مساويًا لـ "CA". بعد هذه الخطوة ، يمكننا بناء صفيفتين ، واحدة (تسمى tot_cases) التي تحتوي على إجمالي الحالات (اسم عمود الرأس المعني هو "tot_cases") والذي يحتوي على عدد الأيام التي مر بها التسجيل الأول (يسمى أيام). نظرًا لتسجيل البيانات يوميًا ، من أجل بناء مصفوفة "الأيام" ، فإننا ببساطة نبني مصفوفة من الأعداد الصحيحة المتباعدة بشكل متساوٍ من 0 إلى طول مصفوفة "tot_cases" ، وبهذه الطريقة ، يشير كل رقم إلى n ° مرت الأيام من التسجيل الأول (اليوم 0).

    في هذه المرحلة ، يمكننا تحديد الوظيفة التي سيتم استخدامها بواسطة curve_fit () لتلائم مجموعة البيانات التي تم إنشاؤها. يتم تعريف الدالة الأسية بالمعادلة:

    ص = أ * إكسب (ب * س) + ج

    أين أ ، ب و ج هي المعلمات المناسبة. سنقوم بتعريف الدالة exp_fit () التي تعيد الدالة الأسية ، ذ، تم تعريفه مسبقًا. تأخذ الدالة curve_fit () إدخالًا ضروريًا لوظيفة الملاءمة التي نريد أن نلائم البيانات معها ، وهما صفيفتا x و y اللذان يتم تخزين قيم نقاط البيانات فيهما. من الممكن أيضًا تقديم تخمينات أولية لكل من معلمات التركيب عن طريق إدراجها في قائمة تسمى p0 = [...] والحدود العليا والسفلى لهذه المعلمات (للحصول على وصف شامل لوظيفة curve_fit () ، يرجى الرجوع إلى https : //docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.curve_fit.html). في هذا المثال ، سنقدم فقط التخمينات الأولية لمعلمات التركيب الخاصة بنا. علاوة على ذلك ، سنلائم فقط إجمالي الحالات لأول 200 يوم ، وذلك لأنه بالنسبة للأيام المتتالية ، لم يعد عدد الحالات يتبع الاتجاه الأسي بعد الآن (ربما بسبب انخفاض في عدد الحالات الجديدة). للإشارة فقط إلى أول 200 قيمة من المصفوفات "أيام" و "tot_cases" ، فإننا نستغل تقطيع المصفوفات (على سبيل المثال ، الأيام [: 200]).

    ناتج curve_fit () هو معلمات التركيب ، معروضة بنفس الترتيب الذي تم استخدامه أثناء تعريفها ، ضمن وظيفة التركيب. مع وضع هذا في الاعتبار ، يمكننا بناء المصفوفة التي تحتوي على النتائج المناسبة ، وتسميتها "fit_eq".

    الآن بعد أن قمنا ببناء المصفوفة المناسبة ، يمكننا رسم كل من نقاط البيانات الأصلية وتناسبها الأسي.

    ستكون النتيجة النهائية عبارة عن قطعة مثل تلك الموجودة في الشكل 1:

    شكل 1


    4.7 كتابة وتطبيق أسي - عرض تقديمي بوربوينت PPT

    يعد موقع PowerShow.com موقعًا رائدًا لمشاركة العروض التقديمية / عرض الشرائح. سواء كان تطبيقك يتعلق بالعمل ، أو الكيفية ، أو التعليم ، أو الطب ، أو المدرسة ، أو الكنيسة ، أو المبيعات ، أو التسويق ، أو التدريب عبر الإنترنت أو لمجرد التسلية ، فإن موقع PowerShow.com يعد مصدرًا رائعًا. والأفضل من ذلك كله ، أن معظم ميزاته الرائعة مجانية وسهلة الاستخدام.

    يمكنك استخدام PowerShow.com للعثور على أمثلة لعروض PowerPoint التقديمية عبر الإنترنت وتنزيلها حول أي موضوع يمكنك تخيله حتى تتمكن من تعلم كيفية تحسين الشرائح والعروض التقديمية مجانًا. أو استخدمه للعثور على عروض تقديمية عالية الجودة لـ PowerPoint وتنزيلها مع شرائح مصورة أو متحركة ستعلمك كيفية القيام بشيء جديد ، مجانًا أيضًا. أو استخدمه لتحميل شرائح PowerPoint الخاصة بك حتى تتمكن من مشاركتها مع المعلمين أو الفصل أو الطلاب أو الرؤساء أو الموظفين أو العملاء أو المستثمرين المحتملين أو العالم. أو استخدمها لإنشاء عروض شرائح صور رائعة حقًا - مع انتقالات ثنائية وثلاثية الأبعاد ورسوم متحركة وخيارات الموسيقى التي يمكنك مشاركتها مع أصدقائك على Facebook أو دوائر Google+. هذا كله مجاني أيضًا!

    مقابل رسوم رمزية ، يمكنك الحصول على أفضل خصوصية على الإنترنت في المجال أو الترويج للعروض التقديمية وعروض الشرائح ذات الترتيب الأعلى بشكل عام. لكن بصرف النظر عن ذلك فهو مجاني. سنقوم بتحويل العروض التقديمية وعروض الشرائح إلى تنسيق الفلاش العالمي بكل مجدها الأصلي للوسائط المتعددة ، بما في ذلك الرسوم المتحركة ، وتأثيرات الانتقال ثنائية وثلاثية الأبعاد ، والموسيقى المضمنة أو أي صوت آخر ، أو حتى الفيديو المضمّن في الشرائح. كل هذا مجانا. يمكن مشاهدة معظم العروض التقديمية وعروض الشرائح على PowerShow.com مجانًا ، بل إن الكثير منها مجاني للتنزيل. (يمكنك اختيار ما إذا كنت ستسمح للأشخاص بتنزيل عروض PowerPoint التقديمية الأصلية وعروض شرائح الصور الخاصة بك مقابل رسوم أو مجانًا أم لا على الإطلاق.) تحقق من PowerShow.com اليوم - مجانًا. حقا هناك شيء للجميع!

    العروض التقديمية مجانًا. أو استخدمه للعثور على عروض تقديمية عالية الجودة لـ PowerPoint وتنزيلها مع شرائح مصورة أو متحركة ستعلمك كيفية القيام بشيء جديد ، مجانًا أيضًا. أو استخدمه لتحميل شرائح PowerPoint الخاصة بك حتى تتمكن من مشاركتها مع المعلمين أو الفصل أو الطلاب أو الرؤساء أو الموظفين أو العملاء أو المستثمرين المحتملين أو العالم. أو استخدمها لإنشاء عروض شرائح صور رائعة حقًا - مع انتقالات ثنائية وثلاثية الأبعاد ورسوم متحركة وخيارات الموسيقى التي يمكنك مشاركتها مع أصدقائك على Facebook أو دوائر Google+. هذا كله مجاني أيضًا!


    إجابه

    لا توجد خيارات لإدخال المستخدم لقيم معاملات التجانس الأسي في مربعات الحوار & quotTime Series Modeler & quot أو بناء جملة TSMODEL. يمكنك تحديد هذه المعلمات عن طريق تشغيل الأمر EXSMOOTH من نافذة بناء الجملة. المعلمات المتاحة هي ALPHA (معلمة التنعيم العامة أو ثابت التنعيم) ، GAMMA (معلمة تجانس الاتجاه) ، DELTA (معلمة التنعيم الموسمية) ، و PHI (معلمة تعديل الاتجاه).

    كان الأمر EXSMOOTH جزءًا من وحدة Trends في الإصدارات الأقدم من SPSS. الإجراءات من وحدة الاتجاهات ، بما في ذلك EXSMOOTH ، وكذلك ARIMA ، AREG (الانحدار مع الأخطاء المرتبطة تلقائيًا) ، وغيرها ، متاحة فقط من خلال أوامر بناء الجملة في الإصدارات الأخيرة من SPSS Statistics. تم تقديم وحدة التنبؤ الجديدة في SPSS 14 وتمت إزالة مربعات حوار الاتجاهات في SPSS 16. تتوفر أوامر بناء جملة الاتجاهات الآن كجزء من Statistics Core ، بحيث يمكنك الوصول إلى الأوامر إذا كان لديك SPSS Statiistics (على الرغم من Student إصدار SPSS لا يتضمن معالجة أوامر بناء الجملة). إذا كنت تريد إدخال معلمات التنعيم للتمهيد الأسي ، فأنت بحاجة إلى تشغيل أمر بناء الجملة EXSMOOTH. فيما يلي مثال من صفحات تعليمات بناء الجملة لـ EXSMOOTH:

    EXSMOOTH VAR2.0
    / نموذج = LA
    / الفترة = 4
    / SEASFACT = (23 -14.4 7 -15.6)
    /ALPHA =0.20
    /GAMMA=0.20
    / DELTA =0.30
    / الأولي = (112،17).

    يحدد هذا الأمر مكون اتجاه خطي مع مكون موسمي مضاف (/ MODEL = LA).

    للاطلاع على تعليمات بناء الجملة لأمر EXSMOOTH ، اكتب EXSMOOTH (الكتابة بالأحرف الكبيرة ليست ضرورية) في نافذة محرر بناء جملة إحصائيات SPSS ، ثم انقر فوق رمز تعليمات بناء الجملة في شريط أدوات إطار بناء الجملة. تبدو هذه الأيقونة على شكل ورقة بها علامة استفهام في الزاوية اليسرى السفلية. لا تظهر أوامر "الاتجاهات" في الدليل المرجعي للصيغة الذي يتم فتحه بالنقر فوق
    تعليمات & gtCommand مرجع بناء الجملة.


    إستعمال

    متجه لقيم مقياس خطي غير أسي يمثل الوقت.

    ثابت المعدل الأول ، معبرًا عنه بالمقلوب للوحدات الزمنية للمحور X. عمر النصف الأول 0.6932 / k1.

    ثابت المعدل الثاني ، معبرًا عنه بالمقلوب للوحدات الزمنية للمحور X. عمر النصف الثاني 0.6932 / k2.

    قيمة واحدة لمدى y في المرحلة الأولى من الاضمحلال ، بوحدات y.

    قيمة واحدة لمدى y في المرحلة الثانية من الاضمحلال ، بوحدات y ..

    أدنى قيمة y متوقعة ، أو القيمة في أوقات غير محدودة ، معبرًا عنها بنفس الوحدات مثل Y.


    الاستخدام الأساسي

    مجموعة البيانات

    ليستخدم epifitter تحتاج البيانات إلى متغيرين على الأقل ، أحدهما يمثل وقت كل تقييم لشدة المرض خلال مسار الأوبئة ويمثل الآخر متغير شدة المرض كنسبة (مثل الحدوث ، والشدة ، والانتشار). في حالة التجارب المصممة مع التكرارات ، هناك حاجة إلى متغير ثالث.

    دعنا نحاكي مجموعة بيانات DPC لوباء واحد تم قياسه في قطع أرض مكررة. تشبه البيانات المحاكاة الأوبئة متعددة الحلقات ذات الشكل السيني. يمكننا القيام بذلك باستخدام epifitter sim_logistic () وظيفة epifitter (المزيد عن؟ sim_logistic هنا).

    دعونا نلقي نظرة على مجموعة البيانات المحاكاة.

    كائن dpc_L الذي تم إنشاؤه باستخدام sim_logistic () هو إطار بيانات يتكون من أربعة أعمدة. المتغير y هو متجه لشدة المرض كنسبة (0 & lt y & lt 1). لتسهيل التصور ، فلنقم بعمل مخطط باستخدام وظيفة ggplot الخاصة بـ ggplot2 صفقة.

    الانحدار الخطي باستخدام fit_lin ()

    تتطلب الدالة fit_lin () على الأقل حجج الوقت و y. في المثال ، سنقوم باستدعاء العشوائية التي تمثل التكرارات. يتم عرض طريقة سريعة لاستدعاء هذه المتغيرات المرفقة بإطار البيانات أدناه.

    تقوم fit_lin () بإخراج كائن قائمة يحتوي على عدة عناصر. يتم عرض ثلاثة عناصر من القائمة بشكل افتراضي: إحصائيات ملاءمة النموذج ، ومعدل الإصابة ، والتلقيح الأولي

    نموذج صالح احصائيات

    يوضح عنصر الإحصائيات في القائمة كيف توقع كل نموذج من النماذج الأربعة الملاحظات بناءً على ثلاثة مقاييس:

    • معامل ارتباط التوافق مع لين CCC (لين 2000) ، وهو مقياس للاتفاق يأخذ التحيز والدقة في الاعتبار
    • معامل التحديد r_squared (R 2) ، مقياس الدقة
    • الانحراف المعياري المتبقي RSE لكل نموذج.

    يتم فرز النماذج الأربعة من الأعلى إلى المنخفض CCC. كما هو متوقع لأنه تم استخدام وظيفة sim_logistic لإنشاء بيانات الوباء الاصطناعية ، فإن ملف جمارك كان النموذج متفوقًا على الآخرين.

    معاملات النموذج

    يتم عرض التقديرات ، والخطأ المعياري ذي الصلة وفاصل الثقة العلوي والسفلي 95٪ ، لمعاملات الاهتمام في معدل العدوى وعناصر اللقاح الأولي. بالنسبة للأخير ، يتم عرض كل من التقدير المرتجع (التقدير) والتقدير الخطي.

    احصائيات عالمية

    يوفر العنصر f_lin $ stats_all إطار بيانات واسع التنسيق مع جميع الإحصائيات لكل نموذج.

    تنبؤات النموذج

    يتم تخزين القيم المتوقعة كإطار بيانات في عنصر البيانات المسمى باستخدام نفس المشغل $ كما هو مذكور أعلاه. يتم عرض كل من التنبؤات المرصودة و (ص) والتنبؤات المحولة (المتوقعة) لكل نموذج. يتم عرض القيمة الخطية والمتبقي أيضًا.

    مؤامرة التنبؤات

    تنتج plot_fit () ، بشكل افتراضي ، لوحة من المؤامرات تصور القيم المرصودة والمتوقعة من قبل جميع النماذج المجهزة. الوسيطتان pont_size و line_size اللذان يتحكمان في حجم النقاط للملاحظة وحجم الخط المناسب ، على التوالي.

    المؤامرات الجاهزة للنشر

    المؤامرات ggplot2 كائنات يمكن تخصيصها بسهولة عن طريق إضافة طبقات جديدة تتجاوز معلمات الرسم كما هو موضح أدناه. تسمح نماذج الحجة بتحديد النماذج (النماذج) التي سيتم عرضها على قطعة الأرض. تم تخصيص قطعة الأرض التالية للنموذج اللوجستي.

    الانحدار غير الخطي

    اثنين من المعلمات

    تستخدم الدالة fit_nlin () خوارزمية Levenberg-Marquardt لتقدير المربعات الصغرى للمعلمات غير الخطية. بالإضافة إلى الوقت وشدة المرض ، يجب إعطاء قيم البداية لـ y0 و r في وسيطة start_par. تنسيق الإخراج والتفسير مماثل لـ fit_lin ().

    ملاحظة: إذا واجهت رسائل خطأ تقول "المصفوفة عند تقديرات المعلمات الأولية" ، فحاول تعديل قيم البداية للمعلمات لحل المشكلة.

    يمكننا التحقق من النتائج باستخدام plot_fit.

    تقدير K (الحد الأقصى من المرض)

    في العديد من الأوبئة ، لا يصل الإجراء الأخير (الوقت النهائي) لـ DPC إلى الحد الأقصى من الشدة ، ولهذا السبب ، قد يكون من الضروري تقدير الحد الأقصى من خط التقارب (القدرة الاستيعابية K). تقدم fin_lin2 () تقديرًا لـ K بالإضافة إلى التقديرات المقدمة بواسطة fit_lin ().

    قبل توضيح الوظيفة ، يمكننا تحويل بيانات المحاكاة الخاصة بنا عن طريق إنشاء متغير آخر باستخدام y_random2 بحد أقصى حوالي 0.8 (80٪). أبسط طريقة هي ضرب y_random في 0.8.

    ثم نقوم بتشغيل fit_nlin2 () لمجموعة البيانات الجديدة.

    تناسب النماذج مع DPCs متعددة

    الأكثر شيوعًا ، هناك أكثر من أوبئة لتحليلها إما من الدراسات القائمة على الملاحظة أو الدراسات التجريبية. عندما يكون الهدف هو ملاءمة نموذج مشترك لجميع المنحنيات ، تكون وظيفة fit_multi () في متناول اليد. يحتاج كل DPC إلى تعريف فريد ليتم دمجه بشكل أكبر في إطار بيانات واحد.

    دعنا نستخدم عائلة sim_ من الوظائف لإنشاء ثلاثة أوبئة وتخزين البيانات في إطار بيانات واحد. تم استخدام نموذج Gompertz لمحاكاة هذه البيانات. لاحظ أننا سمحنا للمعامل y0 و r بالاختلاف في DPCs. يجب أن نجمع DPCs الثلاثة باستخدام الدالة bind_rows () وتسمية المعرف (.id) ، الذي تم إنشاؤه تلقائيًا كمتجه حرف ، لكل أوبئة كـ "DPC".

    يمكننا تصور DPCs الثلاثة في نفس المؤامرة

    أو استخدم facet_wrap () لرسمها بشكل منفصل.

    باستخدام fit_multi ()

    تتطلب fit_multi () أربع حجج على الأقل: الوقت ، وشدة المرض (كنسبة) ، والبيانات ومعرف المنحنى (strata_cols). تقبل الوسيطة الأخيرة واحدة أو أكثر من الطبقات تشمل c (& quotstrata1 & quot، strata2 & quot). في المثال أدناه ، اسم الطبقة هو DPC ، اسم المتغير.

    بشكل افتراضي ، يتم ضبط الانحدار الخطي على البيانات ولكن مع إضافة وسيطة أخرى nlin = T ، يتم تعديل الانحدار غير الخطي بدلاً من ذلك.

    يمكن إرجاع جميع معاملات القائمة باستخدام عامل التشغيل $ على النحو التالي.

    وبالمثل ، يمكن إرجاع جميع البيانات.

    إذا كان الانحدار غير الخطي مفضلًا ، فيجب تعيين الوسيطة nlim على TRUE

    تريد تقدير K؟

    إذا كنت تريد تقدير K ، فاضبط nlin = TRUE و estimated_K = TRUE.

    ملاحظة: إذا لم تقم بتعيين كلا الوسيطتين TRUE ، فلن يتم تقدير K ، لأن nlin defaut هو FALSE. تذكر أيضًا أنه عند تقدير K ، فإننا لا نلائم متسارع نموذج.

    نواتج رسومية

    استخدم ggplot2 لإنتاج تصورات بيانات أنيقة لمنحنيات النماذج والمعلمات المقدرة.

    DPCs والمنحنيات المجهزة

    يتم تخزين البيانات الأصلية والقيم المتوقعة لكل نموذج في بيانات $ multi_fit. يمكن إنتاج قطعة أرض جميلة على النحو التالي:

    معدل الإصابة الظاهر

    عنصر multi_fit $ Parameters هو المكان الذي يتم فيه تخزين جميع الإحصائيات والمعلمات. دعونا نرسم تقديرات معدل الإصابة الظاهر.


    التنبؤ: المبادئ والممارسات (الطبعة الثالثة)

    على الرغم من أن العلاقة الخطية المفترضة حتى الآن في هذا الفصل غالبًا ما تكون كافية ، إلا أن هناك العديد من الحالات التي يكون فيها الشكل الوظيفي غير الخطي أكثر ملاءمة. لتبسيط الأمور في هذا القسم ، نفترض أن لدينا متنبئًا واحدًا فقط (x ).

    إن أبسط طريقة لنمذجة العلاقة غير الخطية هي تحويل متغير التنبؤ (ص ) و / أو متغير التوقع (س ) قبل تقدير نموذج الانحدار. في حين أن هذا يوفر شكلاً وظيفيًا غير خطي ، فإن النموذج لا يزال خطيًا في المعلمات. التحويل الأكثر شيوعًا هو اللوغاريتم (الطبيعي) (انظر القسم 3.1).

    أ سجل الدخول تم تحديد الشكل الوظيفي كـ [ log y = beta_0 + beta_1 log x + varepsilon. ] في هذا النموذج ، يمكن تفسير المنحدر ( beta_1 ) على أنه مرونة: ( beta_1 ) هو متوسط ​​النسبة المئوية للتغير في (ص ) الناتج عن زيادة بنسبة 1٪ في (س ) . يمكن أيضًا تحديد أشكال مفيدة أخرى. ال سجل خطي يتم تحديد النموذج فقط عن طريق تحويل متغير التنبؤ و سجل خطي يتم الحصول على الشكل عن طريق تحويل المتنبئ.

    تذكر أنه من أجل إجراء تحويل لوغاريتمي إلى متغير ، يجب أن تكون جميع قيمه المرصودة أكبر من الصفر. في حالة احتواء هذا المتغير (x ) على أصفار ، نستخدم التحويل ( السجل (x + 1) ) أي نضيف واحدًا إلى قيمة المتغير ثم نأخذ اللوغاريتمات. هذا له تأثير مماثل لأخذ اللوغاريتمات ولكنه يتجنب مشكلة الأصفار. كما أن له أيضًا تأثير جانبي أنيق للأصفار على المقياس الأصلي للأصفار المتبقية على المقياس المحول.

    هناك حالات لن يكون فيها مجرد تحويل البيانات مناسبًا وقد يتطلب الأمر تحديدًا أكثر عمومية. ثم النموذج الذي نستخدمه هو [y = f (x) + varepsilon ] حيث (f ) هي وظيفة غير خطية. في الانحدار القياسي (الخطي) ، (f (x) = beta_ <0> + beta_ <1> x ). في مواصفات الانحدار غير الخطي التالي ، نسمح بأن تكون (f ) دالة غير خطية أكثر مرونة لـ (x ) ، مقارنةً بالتحويل اللوغاريتمي أو أي تحويل آخر.

    واحدة من أبسط المواصفات هي جعل (f ) متعدد التعريف خطي. أي أننا نقدم النقاط التي يمكن أن يتغير فيها ميل (f ). تسمى هذه النقاط عقدة. يمكن تحقيق ذلك من خلال السماح (x_ <1، t> = x ) وإدخال المتغير (x_ <2، t> ) بحيث [ تبدأ x_ <2، t> = (x-c) _ + & amp = left < start 0 & أمبير نص x & lt c x-c & amp text س جنرال الكتريك ج نهايةحق. نهاية] الترميز ((x-c) _ + ) يعني القيمة (x-c ) إذا كانت موجبة و 0 بخلاف ذلك. هذا يفرض المنحدر على الانحناء عند النقطة (ج ). يمكن تضمين الانحناءات الإضافية في العلاقة عن طريق إضافة المزيد من المتغيرات من النموذج أعلاه.

    العلاقات الخطية المتقطعة المبنية بهذه الطريقة هي حالة خاصة من خطوط الانحدار. بشكل عام ، يتم الحصول على شريحة الانحدار الخطي باستخدام [x_ <1> = x quad x_ <2> = (x-c_ <1>) _ + quad dots quad x_ = (س- ج_) _ + ] حيث (c_ <1> ، النقاط ، ج_) هي العقد (النقاط التي يمكن للخط أن ينحني عندها). قد يكون تحديد عدد العقد ( (k-1 )) والمكان الذي يجب أن يتم وضعها فيه أمرًا صعبًا وتعسفيًا إلى حد ما. تتوفر بعض خوارزميات الاختيار التلقائي للعقدة ، ولكنها غير مستخدمة على نطاق واسع.

    التنبؤ بالاتجاه غير الخطي

    في القسم 7.4 ، تم تقديم ملاءمة الاتجاه الخطي لسلسلة زمنية عن طريق ضبط (x = t ). إن أبسط طريقة لملاءمة الاتجاه غير الخطي هي استخدام اتجاهات الترتيب التربيعي أو الأعلى التي تم الحصول عليها عن طريق تحديد [x_ <1، t> = t، quad x_ <2، t> = t ^ 2، quad dots. ] ومع ذلك ، لا يوصى باستخدام الاتجاهات التربيعية أو الاتجاهات العليا في التنبؤ. عندما يتم استقراءها ، غالبًا ما تكون التوقعات الناتجة غير واقعية.

    النهج الأفضل هو استخدام المواصفات متعددة التعريف التي تم تقديمها أعلاه وتناسب الاتجاه الخطي متعدد التعريفات الذي ينحني في وقت ما. يمكننا التفكير في هذا على أنه اتجاه غير خطي مبني من قطع خطية. إذا كان الاتجاه ينحني في الوقت ( tau ) ، فيمكن تحديده ببساطة عن طريق استبدال (x = t ) و (c = tau ) أعلاه بحيث نقوم بتضمين المتنبئين ، [ ابدأ x_ <1، t> & amp = t x_ <2، t> & amp = (t- tau) _ + = left < start 0 & أمبير نص t & lt tau t- tau & amp text t ge tau endحق. نهاية] في النموذج. إذا كانت المعاملات المرتبطة بـ (x_ <1، t> ) و (x_ <2، t> ) هي ( beta_1 ) و ( beta_2 ) ، فإن ( beta_1 ) يعطي منحدر الاتجاه قبل الوقت ( tau ) ، بينما يتم إعطاء ميل الخط بعد الوقت ( tau ) بواسطة ( beta_1 + beta_2 ). يمكن تضمين الانحناءات الإضافية في العلاقة عن طريق إضافة المزيد من المتغيرات من النموذج ((t- tau) _ + ) حيث ( tau ) هي "العقدة" أو النقطة الزمنية التي يجب أن ينحني عندها الخط.

    مثال: مرات الفوز في ماراثون بوسطن

    سنلائم بعض عارضات الأزياء مع أوقات فوز الرجال في ماراثون بوسطن. أولاً نستخرج بيانات الرجال ونحول أوقات الفوز إلى قيمة عددية. تم إطالة الدورة (من 24.5 ميلاً إلى 26.2 ميلاً) في عام 1924 ، مما أدى إلى قفزة في أوقات الفوز ، لذلك نحن فقط نأخذ في الاعتبار البيانات من ذلك التاريخ فصاعدًا.

    تُظهر اللوحة العلوية للشكل 7.20 أوقات الفوز منذ عام 1924. تُظهر السلسلة الزمنية اتجاهًا هبوطيًا عامًا حيث كانت أوقات الفوز تتحسن على مر السنين. تعرض اللوحة السفلية القيم المتبقية من ملاءمة الاتجاه الخطي للبيانات. تُظهر الحبكة نمطًا غير خطي واضحًا لم يتم التقاطه بواسطة الاتجاه الخطي.

    الشكل 7.20: ملاءمة الاتجاه الخطي لأوقات الفوز في ماراثون بوسطن غير كافٍ

    يمكن تحقيق ملاءمة الاتجاه الأسي (المكافئ لانحدار لوغاريتمي خطي) للبيانات عن طريق تحويل متغير (y ) بحيث يكون النموذج المراد تركيبه ، [ log y_t = beta_0 + beta_1 t + varepsilon_t. ] The fitted exponential trend and forecasts are shown in Figure 7.21. Although the exponential trend does not seem to fit the data much better than the linear trend, it perhaps gives a more sensible projection in that the winning times will decrease in the future but at a decaying rate rather than a fixed linear rate.

    The plot of winning times reveals three different periods. There is a lot of volatility in the winning times up to about 1950, with the winning times barely declining. After 1950 there is a clear decrease in times, followed by a flattening out after the 1980s, with the suggestion of an upturn towards the end of the sample. To account for these changes, we specify the years 1950 and 1980 as knots. We should warn here that subjective identification of knots can lead to over-fitting, which can be detrimental to the forecast performance of a model, and should be performed with caution.

    Figure 7.21: Projecting forecasts from linear, exponential and piecewise linear trends for the Boston marathon winning times.

    Figure 7.21 shows the fitted lines and forecasts from linear, exponential and piecewise linear trends. The best forecasts appear to come from the piecewise linear trend.


    شاهد الفيديو: الدوال الأسية: حساب النهايات جزء1 (ديسمبر 2021).