Scrap-project-and-data-analysis

Extracting news data

Stars
0
Committers
2

در این پروژه ابتدا از سایت خبری باآدرس https://akharinkhabar.ir گروه ورزشی، جامعه و حوادث و اقتصادی خبر هایی که در آن ها وجود داشت رو دریافت کردم و برای هر دیتا نام مربوط به اون رو قرار دادم و یک فایل اکسل از این دیتا در کدهایم ایجاد کردم که به صورت زیر بتونم اون هارو مشاهده کنم.

اما همانطور که در عکس معلوم هست دیتاهای دریافت شده تغییراتی رو نیاز دارند مثلا زمان ما بر حسب دقیقه پیش یا ساعت پیش هست و یا برای بازدید ها در پشت عدد k رو برای هر هزار بازدید قرار داده است و برای تغییر این دو کدهایی نوشته شده است که ابتدا تبدیل زمان رو انجام بدهد و بر حسب دقیقه اون رو بدست بیاریم که در عکس زیر ستون converted_time می باشد، اما بازهم ما تاریخ و زمان دقیق رو نداریم و برای این کار هم از دیتایی که در اختیار داشتیم کدهایی نوشتیم تا تاریخ و زمان دقیق رو حساب کنیم که نام ستون اون date_time می باشد. همچنین برای از بین بردن k در دیتای بازدید ها کدهایی نوشته شده شده که بجای k عدد رو در هزار ضرب کند تا نیاز به k بعد از عدد نباشد، همانطور که در ستون view_count مشاهده می کنید. در پایان همه ی تحلیل داده ها فایل اکسلی به صورت زیر خواهیم داشت.

در ادامه تصمیم گرفتم تا تاریخ و زمان رو هم به صورت شمسی در کنار میلادی داشته باشیم. که به صورت زیر می باشد.

Related Projects