لینک دانلود و خرید پایین توضیحات دسته بندی : پاورپوینت نوع فایل : powerpoint (..ppt) ( قابل ويرايش و آماده پرينت ) تعداد اسلاید : 29 اسلاید
قسمتی از متن powerpoint (..ppt) :
بسم الله الرحمن الرحيم روشهاي جمع آوري داده ها روشهاي جمع آوري داده ها : تكنيكهاي جمع آوري داده ها به ما اجازه مي دهند تا بطور سيستمتيك اطلاعات مربوط به اهداف مطالعه ( مردم، اهداف ، پديده ها) و شرايطي كه آنها رخ داده اند ، جمع آوري گردد. تكنيكهاي مختلف جمع آوري داده ها عبارتند از : 1- استفاده از اطلاعات در دسترس Using Available Information 2- مشاهده Observing 3- مصاحبه ( چهره به چهره ) Interviewing 4- پرسشنامه هاي كتب ي Administrating written questionnaires الف- استاندارد ب- پژوهشگر ساخته 5- F.G-D بحث گروهي متمركز Focus group Discussion 6- تكنيكهاي تصويري Projective techniques mapping of scaling 1-ا ستفاده از اطلاعات در دسترس : معمولا مقدارزيادي از داده ها هستند كه همين الان توسط ديگران جمع آوري مي شوند كه شايد نيازي به تحليل يا انتشار هم ندارند.توجه به اين منابع و فراوري اين اطلاعات شروع خوبي در هر برنامه جمع آوري داده ها هست.
لینک دانلود و خرید پایین توضیحات دسته بندی : پاورپوینت نوع فایل : powerpoint (..ppt) ( قابل ويرايش و آماده پرينت ) تعداد اسلاید : 22 اسلاید
قسمتی از متن powerpoint (..ppt) :
بنام خدا ساختارها ي ا يندکس ثانو ي ،پردازش همزمان داده ها File Structure ساختارها ي ا يندکس ثانو ي ،پردازش همزمان داده ها چگونه ايندکس ها ي ثانو ي جهت ايجاد مسيري ترکيبي استفاده ميگردند؟ ترکيب چند ايندکس ثانوي چگونه انجام ميشود؟ روشها ي بهينه سازي ساختار ايندکس ثانوي کدامند؟ چگونه از ليست هاي معکوس در ساختار ايندکس استفاده ميگردد؟ چگونه ميتوان از ايندکس ها جهت دسته بندي اطلاعات استفاده نمود؟ انواع روشها ي اتصال ايندکس ها به داده ها کدامند؟ منظوراز پردازش همزمان داده ها چيست؟ الگوريتم مقايسه يا ادغام داده ها چگونه است؟ File Structure ساختارها ي ا يندکس ثانو ي ( Secondary Index structures ) چگونه ايندکس ها ي ثانو ي جهت ايجاد مسيري ترکيبي استفاده ميگردند؟ ترکيب چند ايندکس ثانوي چگونه انجام ميشود؟ ( combination ) مثال : فايل اطلاعات مربوط به آهنگ ها در نظر ميگيريم. مي خواهيم تمام آهنگ هاي BEETHOVEN با تيتر symphony No . 9 را پيدا کنيم. جدول زير با ترکيب دو ايندکس composer و title اين نتيجه را به ما خواهد داد. با استفاده از ليست نهايي ( mached list ) و با کمک ايندکس اصلي رکوردها را ميخوانيم . RCA2626 DG18807 DG18807 DG18807 COL31809 DG139201 ANG3795 ANG3795 ANG3795 Matched list (A & B) Matches from title index Matches from composer index File Structure ساختارها ي ا يندکس ثانو ي چه اشکال اتي در ساختار اوليه ايندکس ثانوي وجود دارد ؟ براي هر کليد جديد (حتي با مقدار تکرار ي ) بايستي ايندکس دوباره مرتب شود. مقادير تکراري کليد ثانوي فضايي را اشغال مي کنند که مي توانستيم صرفه جويي نماييم. مثال: Secondary key Primary key Beethoven Beethoven Beethoven Beethoven Corea Dvorak Prokofiev ANG 3795 DG 139201 DG 18807 RC A2626 WAR 23699 COL 318091 LON 2312
لینک دانلود و خرید پایین توضیحات دسته بندی : پاورپوینت نوع فایل : powerpoint (..pptx) ( قابل ويرايش و آماده پرينت ) تعداد اسلاید : 16 اسلاید
قسمتی از متن powerpoint (..pptx) :
داده کاوی فهرست + مقدمه --------------------------------------------- 4 حوزه فعالیتهای داده کاوی ---------------------------- 5 روش آنالیز آماری ----------------------------------- 7 روش داده کاوی ------------------------------------- 7 مراحل کاری در داده کاوی -------------------------- 12 مثال تفهیمی در مورد داده کاوی --------------------- 12 مراجع --------------------------------------------- 14 نتیجه گیری ---------------------------------------- 15 مقدمه پيشينه طرح موضوع دادهكاوي به دهه 1980 و به صورت جدي، به دهه 1990 برميگردد. پيش از آن٬ از سيستمهاي جمعآوري و مديريت دادهها و اصطلاحاً لايروبي دادهها استفاده ميشد٬ اما به مرور زمان٬ استخراج و كشف سريع و دقيق اطلاعات با ارزش و پنهان از پايگاه دادهها بهعنوان دادهكاوي مورد توجه قرار گرفت. به اين شكل بود كه فرايند دادهكاوي به عنوان فرايند آماري و تجزيه و تحليل درفرايند كشف دانش در پايگاه دادهها ( KDD ) پررنگ شد ،به حدي كه گاه٬ دادهكاوي ( DM ) بهعنوان مترادف كشف دانش در پايگاه دادهها( KDD ) مورد استفاده قرار ميگرفت [2] . امروزه فرايند استخراج اطلاعات معتبر٬ از پيش ناشناخته٬ قابل فهم و قابل اعتماد از پايگاه دادههاي بزرگ و استفاده از آن در تصميمگيري و در فعاليتهاي تجاري دادهكاوي ناميده ميشود [1] . در تعاريف متعدد و متنوع براي دادهكاوي برموضوعاتي نظير: استخراج دانش كلان٬ كاوش در دادهها٬ تجزيه و تحليل دادهها و يافتن روابط و الگوهاي مطمئن بين دادهها تاكيد ميشود. هدف نهايي دادهكاوي٬ ايجاد سيستمهاي پشتيباني تصميمگيري سازماني است. دادهكاوي به استخراج اطلاعات مفيد و دانش از حجم زياد دادهها ميپردازد. دادهكاوي٬ الگوهاي حاوي اطلاعات را در دادههاي موجود جستوجو ميكند. اين الگوها و الگوريتمها، ميتوانند توصيفي باشند يعني دادهها را توصيف كنند و يا جنبه پيشبيني داشته باشند، يعني از متغيرها براي پيشبيني ارزشهاي ناشناخته ساير متغيرها بهكار روند. دادهكاوي توصيفي، بهدنبال يافتن اگرها در فعاليتها يا اقدامات گذشته است و دادهكاوي پيشبينانه با نگاه به سابقه٬ رفتار آینده را پيشبيني ميكند [1] . حوزه فعالیتهای داده کاوی هدف دادهكاوي٬ تجزيه و تحليلاكتشافي دادهها٬ كشف الگوها و قواعد و الگوريتمها٬ مدلسازي پيشبينانه وجستوجوي انحرافات است. براي انجام اين هدف٬ فرايند دادهكاوي درجهت كشف دانش درمراحل مختلف انجام ميشودكه عبارت است از: 1. شناسايي هدف و فهم حوزه كاربرد آن است و مشخص ميكند كه چهكاري٬ در چه حوزهايانجام خواهد شد. 2. انتخاب دادهها يعني تعيين اهداف براي تجزيه و تحليل و كشفآن 3. آمادهسازي دادهها شامل تميزسازي دادهها 4. اتخاذ بهترين روشدادهكاوي براي دستيابي به اهداف 5. اجراي دادهكاوي يعني بهكارگيريالگوريتم 6. ارزيابي و اعتبارسنجي يافتهها 7. استفاده از نتايج و تثبيت وتحكيم دانش كشف شده 8. تصميم گيري براساس دانش كشف شده اکتشاف در این مرحله معمولا با آماده سازی داده ها که ممکن است شامل تمیز کردن داده ها ، تبدیل داده ها ، زیر مجموعه های انتخاب آثار ضبط شده و انجام برخی از عملیات اولیه انتخابشروع می شود . سپس بسته به ماهیتتحلیلی ، این مرحله از فرایند استخراج داده ها ممکن است شامل هر انتخاب ساده و سرراست برای یک مدل رگرسیون استادانه درست شده را به تجزیه و تحلیل اکتشافی با استفاده از طیف گسترده ای از روش های گرافیکی و آماری به منظور شناسایی متغیرهای مربوطه و تعیین پیچیدگی از طبیعت مدل ها باشد. البته ناگفته نماند که داده کاوی معمولا با نوشتنمقدار زیادی گزارش و تحقیق و استعلام در آنها اشتباه گرفته می شود. اما در واقعداده کاوی هیچ کدام از اینها را شامل نمی شود. داده کاوی توسط تجهیزات خاصی صورتمی پذیرد، که عملیات کاوش را بر اساس تجزیه و تحلیل مکرر داده ها انجام می دهد
لینک دانلود و خرید پایین توضیحات دسته بندی : پاورپوینت نوع فایل : powerpoint (..ppt) ( قابل ويرايش و آماده پرينت ) تعداد اسلاید : 22 اسلاید
قسمتی از متن powerpoint (..ppt) :
بنام خدا Lecture 11 ساختارها ي ا يندکس ثانو ي ،پردازش همزمان داده ها Secondary Index structures, Co-sequential processing (Sections 7.7-7.9, 8.1-8.2) File Structure ساختارها ي ا يندکس ثانو ي ،پردازش همزمان داده ها چگونه ايندکس ها ي ثانو ي جهت ايجاد مسيري ترکيبي استفاده ميگردند؟ ترکيب چند ايندکس ثانوي چگونه انجام ميشود؟ روشها ي بهينه سازي ساختار ايندکس ثانوي کدامند؟ چگونه از ليست هاي معکوس در ساختار ايندکس استفاده ميگردد؟ چگونه ميتوان از ايندکس ها جهت دسته بندي اطلاعات استفاده نمود؟ انواع روشها ي اتصال ايندکس ها به داده ها کدامند؟ منظوراز پردازش همزمان داده ها چيست؟ الگوريتم مقايسه يا ادغام داده ها چگونه است؟ File Structure ساختارها ي ا يندکس ثانو ي ( Secondary Index structures ) چگونه ايندکس ها ي ثانو ي جهت ايجاد مسيري ترکيبي استفاده ميگردند؟ ترکيب چند ايندکس ثانوي چگونه انجام ميشود؟ ( combination ) مثال : فايل اطلاعات مربوط به آهنگ ها در نظر ميگيريم. مي خواهيم تمام آهنگ هاي BEETHOVEN با تيتر symphony No . 9 را پيدا کنيم. جدول زير با ترکيب دو ايندکس composer و title اين نتيجه را به ما خواهد داد. با استفاده از ليست نهايي ( mached list ) و با کمک ايندکس اصلي رکوردها را ميخوانيم . RCA2626 DG18807 DG18807 DG18807 COL31809 DG139201 ANG3795 ANG3795 ANG3795 Matched list (A & B) Matches from title index Matches from composer index File Structure ساختارها ي ا يندکس ثانو ي چه اشکال اتي در ساختار اوليه ايندکس ثانوي وجود دارد ؟ براي هر کليد جديد (حتي با مقدار تکرار ي ) بايستي ايندکس دوباره مرتب شود. مقادير تکراري کليد ثانوي فضايي را اشغال مي کنند که مي توانستيم صرفه جويي نماييم. مثال: Secondary key Primary key Beethoven Beethoven Beethoven Beethoven Corea Dvorak Prokofiev ANG 3795 DG 139201 DG 18807 RC A2626 WAR 23699 COL 318091 LON 2312
لینک دانلود و خرید پایین توضیحات دسته بندی : پاورپوینت نوع فایل : powerpoint (..ppt) ( قابل ويرايش و آماده پرينت ) تعداد اسلاید : 41 اسلاید
قسمتی از متن powerpoint (..ppt) :
بنام خدا 1 2 داده کاوي الگوهاي تکرارشونده در جريان دادهها 3 جريان داده بسياری از برنامه های کاربردی نوع داده جديدی به نام جريان داده را توليد و تحليل می کنند که در آن داده ها به صورت پويا به يک بستر ( يا پنجره ) وارد و يا از آن خارج می شوند . خواص جريان داده : حجم زياد و گاه نامحدود تغييرپويا جريان به درون و خارج با يک ترتيب مشخص پيمايش يکبار يا تعدا د محدود نيازمند زمان پاسخ سريع ( اغلب بلادرنگ ) ممکن است دارای چندين منبع باشند . 4 جريان داده بايگانی پايگاه داده های موجود در سيستم منبع چکنويس سيستم مديريت جریان داده جريان های ورودی صادرکردن پرسوجوی پيوسته ذخيره نتايج حاصل از جريان نتایج پرس و جوی جريان يک نگاه کلی به جريان داده 5 جريان داده در جريان داده تعدادی يا همه داده های ورودی که بايد روی آنها عمليات انجام شود روی ديسک يا حافظه اصلی قرار ندارند و بيشتر به صورت جريان داده پيوسته می رسند . جريان داده ها از داده های ذخيره شده در موارد زير متفاوت اند : عناصر داده ها به صورت بر خط می رسند . سيستم هيچ گونه کنترلی روی ترتيب عناصر داده ای ( روی عناصر جريان يا جريانهای داده ای ) ، که جهت پردازش می رسند ، ندارد . جريانهای داده ای به صورت ذاتی از نظر اندازه نامحدود هستند . يک عنصر از جريان داده پس از پردازش يا ناديده در نظر گرفته می شود يا آرشيو می شود .
لینک دانلود و خرید پایین توضیحات دسته بندی : پاورپوینت نوع فایل : powerpoint (..ppt) ( قابل ويرايش و آماده پرينت ) تعداد اسلاید : 12 اسلاید
قسمتی از متن powerpoint (..ppt) :
بنام خدا بازسازی داده های هواشناسی 1- روش میانگین حسابی بازسازی آمار گم شده بارندگی حداقل به سه ایستگاه مجاور با آمار کامل نیاز است. در صورتیکه اختلاف بین مقادیر متوسط بارندگی دراز مدت در ایستگاه های مجاور با ایستگاه مورد نظر کمتر از 10 درصد مقدار متوسط بارندگی دراز مدت در ایستگاه مورد نظر باشد می توان از این روش استفاده کرد. A B C D P A : مقدار بارندگی در دوره مشخص در ایستگاه A N A : مقدار بارندگی دراز مدت در ایستگاه A P B : مقدار بارندگی در دوره مشخص در ایستگاه B N B : مقدار بارندگی دراز مدت در ایستگاه B P C : مقدار بارندگی در دوره مشخص در ایستگاه C N C : مقدار بارندگی دراز مدت در ایستگاه C P D : مقدار بارندگی در دوره مشخص در ایستگاه D N D : مقدار بارندگی دراز مدت در ایستگاه D
2- روش میانگین وزنی (نسبت نرمال) در صورتیکه اختلاف بین مقادیر N A با N B ، N C و N D بیشتر از 10 درصد N A باشد.
Px : مقدار بارندگی در دوره مشخص در ایستگاه x (دارای آمار مفقود شده) Nx : مقدار بارندگی دراز مدت در ایستگاه x n : تعداد ایستکاه های مجاور Pi : مقدار بارندگی در دوره مشخص در ایستگاه i (دارای آمار کامل) Ni : مقدار بارندگی دراز مدت در ایستگاه i
لینک دانلود و خرید پایین توضیحات دسته بندی : پاورپوینت نوع فایل : powerpoint (..ppt) ( قابل ويرايش و آماده پرينت ) تعداد اسلاید : 14 اسلاید
قسمتی از متن powerpoint (..ppt) :
بنام خدا File Structure بازيابي سريع داده ها – مرتب ساز ي (Finding data quickly – Sorting) روشها ي بازيابي سريع داده ها چگونه ميباشند؟ يادآور ي جستجوي دودويي ( Binary Searching )؟ مقايسه با جست وجوي سري( sequential )؟ محدوديت ها يا معايب جست و جوي دودويي کدامند ؟ مرتب سازي کليدها ( key sorting ) چگونه است؟ روش Indexing چيست؟ مزاياي Indexing کدامند؟ File Structure بازيابي سريع داده ها روشها ي بازيابي سريع داده ها چگونه ميباشند؟ يادآور ي جستجوي دودويي ( Binary Searching )؟ مثال: يک فايل با رکورد هاي به طول ثابت را در نظر ميگيريم. فرض کنيم که در جست و جوي رکوردي با مقدار کليدي مشخصي ميباشيم. حالت اول: اگر فايل مرتب ن شده باشد : بايستي رکورد ها ي آنرا يک به يک خوانده و کليد آنها را با مقدار مورد نظر مقايسه کنيم . اين کار ممکن است به خواندن کليه رکورد ها منتهي شود. (چرا؟) حالت دوم: اگر فايل بر حسب کليد مورد نظر مرتب شده باشد : روش بهينه همان جست و جوي دودويي ميباشد . (چرا؟) الگوريتم آن در شکل 13-6 کتاب موجود است. ( با اشتباه چاپ ي ! ) File Structure بازيابي سريع داده ها يادآور ي الگوريتم جستجوي دودويي : int BinarySearch (FixedRecordFile & File, RecType & obj, KeyType & key) { int low = 0; int high = file.NumRecs()-1; While (low { int guess = (high + low) / 2; file.ReadByRRN (obj, guess); if (obj.Key() == key) return 1; if (obj.Key() else high = guess - 1; } return 0; } low RRN high 0 1 3 n .... .... File Structure بازيابي سريع داده ها مقايسه با جست وجوي سري( sequential )؟ مثال: جستجو ي کليد در يک فايل با تعداد 2000 = n رکورد . حالت اول: جست و جوي سري : تعداد ماکزيمم رکورد هاي خوانده شده برابر با تعداد کل رکورد ها خواهد بود. ممکن است تا 2000 رکورد خوانده شود. اگر تعداد رکورد ها دوبل شود ، تعداد خواندن رکورد نيز دوبل خواهد شد . (چرا؟) حالت دوم: جست و جوي دودويي : تعداد ماکزيمم رکورد هاي خونده شده برابر با 1+log(n) خواهد بود. ممکن است تا 1+log(2000) يعني 11 رکورد خوانده شود. اگر تعداد رکورد ها دوبل شود ، فقط يک خواندن رکورد اضافه مي گردد. برا ي جست و جوي دودويي باي ستي طول رکورد ها ثابت باشد. (چرا؟)
لینک دانلود و خرید پایین توضیحات دسته بندی : پاورپوینت نوع فایل : powerpoint (..ppt) ( قابل ويرايش و آماده پرينت ) تعداد اسلاید : 65 اسلاید
قسمتی از متن powerpoint (..ppt) :
بنام خدا بررسی روشهای خوشه بندی پايگاههای داده بزرگ فهرست مطالب بررسی الگوريتم BIRTCH [ZRL96] بررسی الگوريتم CURE [GRS98] بررسی الگوريتم DBCLASD [XEK98] بررسی الگوريتم موازی PFDC [M02] خلاصه و نتايج فهرست منابع الگوريتم BIRCH تعاريف پايه در مورد خوشه { Xi }
لینک دانلود و خرید پایین توضیحات دسته بندی : پاورپوینت نوع فایل : powerpoint (..ppt) ( قابل ويرايش و آماده پرينت ) تعداد اسلاید : 33 اسلاید
قسمتی از متن powerpoint (..ppt) :
بنام خدا پالایش شمای داده و صورت های نرمال Schema Refinement and Normal Forms مشکلات Redundancy ذخیره تکراری آنومالی به روز رسانی ( Update ) آنومالی درج ( Insert ) آنومالی حذف ( Delete ) آنومالي در عمليات درج به هريك از سه وضع زير گفته ميشود: عدم امكان انجام يك عمل (كه منطقا بايد قابل انجام باشد) بروز پيامد بد پس از انجام يك عمل بروز فزونكاري در سيستم در انجام يك عمل صورتهاي نرمال ( Normal Form ) صورت نخست نرمال ( 1NF ) صورت دوم نرمال ( 2NF ) صورت سوم نرمال ( 3NF ) صورت نرمال بايس-كاد ( BCNF ) صورت چهارم نرمال ( 4NF ) صورت پنجم نرمال ( 5NF ) صورت نرمال ميدان-كليدي ( DKNF ) صورت نرمال تحديد-اجتماع ( RUNF )