استخراج جدول از PDF در پایتون

استخراج داده ها از فایل پی دی اف با استفاده از پایتون (aparat.com)

در این مقاله نحوه استخراج جداول از فایل های پی دی اف با استفاده از پایتون را خواهید آموخت. PDF یک فرمت محبوب برای به اشتراک گذاری داده است، با این حال، استخراج جداول از PDF می تواند یک کار چالش برانگیز باشد. چندین کتابخانه پایتون وجود دارد که می‌توانند در انجام این کار به ما کمک کنند. با این حال، استخراج دقیق داده ها ممکن است وجود نداشته باشد.

ادامه مطلب...
۲۵ خرداد ۰۲ ، ۰۹:۱۶ ۰ نظر موافقین ۰ مخالفین ۰
احمد

استخراج جدول از PDF با استفاده از نرم‌افزار tabula

بانک مرکزی و اکثر نهادها در ایران معمولا داده‌ها را به صورت pdf منتشر می‌کنند اما با پکیج tabula در پایتون می‌توانید اون‌ها را به csv تبدیل کنید یا مستقیما در pandas باهاشون کار کنید. با وجود اینکه داده فارسی بود خروجیش خوب بود. pypi.org/project/tabula
---------------------------------

اگر شما تا به حال با چالش اس
تخراج جدول از فایل‌های پی‌دی‌اف مواجه شده‌اید خواندن این مطلب را به شما توصیه می‌کنیم، اگر هم تا به حال با این مشکل روبرو نشده‌اید آن را مطالعه کنید چرا که در این دنیایی که اهمیت داده هر روز بیشتر می‌شود بهتر است درباره روش‌های استخراج داده اطلاعاتی داشته باشید.

ادامه مطلب...
۲۵ خرداد ۰۲ ، ۰۹:۱۴ ۰ نظر موافقین ۰ مخالفین ۰
احمد

پاکسازی داده در اکسل؛ از فرمول‌های پرکاربرد تا مراحل اصلی عملیات

اولین قدم برای شروع کار روی یک مجموعه داده، پیدا کردن اطلاعات غلط و بی‌ارزش در آن و حذف آنهاست. در این مطلب ابتدا با فرمت‌های رایج ذخیره‌سازی داده آشنا می‌شویم. سپس یاد می‌گیریم که چطور از چند فرمول پرکاربرد اکسل در عملیات پاکسازی داده استفاده کنیم. بعد از آن نکات مهم فرایند وارد کردن فایل‌های CSV به اکسل را مرور می‌کنیم. در آخر نیز مراحل اصلی عملیات پاکسازی و کاربرد چندین فرمول مهم در این زمینه را فرا می‌گیریم. اکثر روش‌ها و فرمول‌هایی که در این مطلب به آنها اشاره می‌شود علاوه بر اکسل در نر‌م‌افزارها و اپلیکیشن‌های مشابهی مانند Google Spreadsheets هم قابل استفاده هستند.

ادامه مطلب...
۲۵ خرداد ۰۲ ، ۰۹:۱۰ ۰ نظر موافقین ۰ مخالفین ۰
احمد

کارتوگرام

کارتوگرام نقشه‌ای است که در آن شکل و اندازه‌ی مناطق جغرافیایی با توجه به مقدار متناظر با هر منطقه در یک مجموعه‌ی داده‌ی مشخص(مانند جمعیت مناطق مختلف یک کشور)، تغییر پیدا می‌کند.

Making a Cartogram in R - YouTube

Video: Create a map style with Cartogram | Help | Mapbox

City Building with OSM Data | Part 1 | Prepare Open Street Map Data - YouTube

ادامه مطلب...
۲۵ خرداد ۰۲ ، ۰۸:۵۹ ۰ نظر موافقین ۰ مخالفین ۰
احمد

چگونه علم آمار اقتدار خود را از کف داد؟

برای سال‌های طولانی، آمارْ اسلحۀ اصلیِ جنگ‌های سیاسی بوده است. در بزنگاه هر انتخابات، طرفین رقیب، با کمال جدیت، به تدوین، استخراج و تفسیر آمارها مشغول بوده‌اند. اما گویا این روزها از تیزی این تیغ کاسته شده است. مردم از سیاست‌مدارانی که مدام از بالاوپایین‌شدن چند شاخص بی‌معنی حرف می‌زنند خسته شده‌اند. آخر از کجا معلوم که این آمارها راست باشد و دست‌کاری نشده باشد؟ چرا چنین اتفاقی افتاده است و جایگزین آمار چیست؟

ادامه مطلب...
۲۴ خرداد ۰۲ ، ۲۳:۱۰ ۰ نظر موافقین ۰ مخالفین ۰
احمد

فرصت‌های جهانی بانکداری باز

دومین دستورالعمل خدمات پرداخت (PSD2) از ابتدای ژانویه سال جاری میلادی (2018) اجرایی شد. شورای اروپا بازبینی این دستورالعمل را در نوامبر سال 2015 میلادی تصویب کرده و چارچوبی را طراحی کرده بود که رابط‌های (APIs) بانکداری باز در یک بازه چندساله توسعه یابند. پیاده‌سازی آن البته با یک رویکرد بدون تمایز به پیش رفته که باعث تاخیرهای قابل‌توجهی در مراحل اولیه اجرا شده است. تنها 11 دولت اروپایی توانسته‌اند که PSD2 را با مقررات محلی منطبق سازند.

ادامه مطلب...
۲۴ خرداد ۰۲ ، ۲۳:۰۹ ۰ نظر موافقین ۰ مخالفین ۰
احمد

داده باز

The ODI – Open Data Institute

Making Iranian Data Available to the public (iranopendata.org)

داده باز: چیستی و مصادیق - موضوعات مرتبط با شفافیت / داده‌‌ی باز - تالار گفتگوی دغدغه‌مندان حوزه شفافیت و مبارزه با فساد (tp4.ir)

داده باز (open data) در علم چیست و چه مزایایی دارد؟ - تَرجُلِیت (tarjolate.com)

آشنایی با استاندارد دادههای باز (linkedin.com)

پایگاه باز داده‌های آماری ایران؛ یک گام ارزشمند در خارج از ایران | راهک (raahak.com)

Challenges of Access to Data of Ministry of Health from the Perspective of Policy-makers, Producers, and Consumers of Data: A Qualitative Study (tums.ac.ir)

ایجاد جریان آزاد اطلاعات برای غلبه بر چالش‌های غذایی (iana.ir)

Global Open Data For Agriculture and Nutrition | GODAN

۲۴ خرداد ۰۲ ، ۲۲:۵۸ ۰ نظر موافقین ۰ مخالفین ۰
احمد

تد، علم و نگاه مغرضانه ما

احتمالا اکثر ما، وقتی یک ویدیو از تد روی یوتیوب قرار می‌گیرد و آن را مشاهده می‌کنیم به صورت پیش‌فرض، اطلاعاتش را موثق می‌دانیم. به هر حال به این راحتی‌ها از فیلترهای مختلف عبور نمی‌کند تا به استیجِ تد برسد.

ادامه مطلب...
۲۴ خرداد ۰۲ ، ۲۲:۳۵ ۰ نظر موافقین ۰ مخالفین ۰
احمد

بحران تکرارپذیری

در سال های اخیر ، از اوایل سال 2010 ، جامعه علمی توجه موجود را به خود جلب کرده است بحران تکرارپذیری در علم ، به ویژه در روانشناسی و پزشکی- نتایج بسیاری از تحقیقات یا تکرار غیرممکن است یا به سادگی ، تلاشی برای انجام این کار انجام نمی شود.

با این حال ، مشکلات مربوط به تأیید فرضیه تنها مواردی نیستند که در بحران تکرار گنجانده شده اند ، اما ماهیت گسترده تری دارند. از این نظر ، شایسته است که اهمیت جعل نتایج ، به ویژه در زمینه روانشناسی اجتماعی ، و سایر عوامل بسیار مهم روش شناختی برجسته شود.

  • مقاله مرتبط: "15 نوع تحقیق (و ویژگی ها)"
ادامه مطلب...
۲۴ خرداد ۰۲ ، ۲۲:۳۲ ۰ نظر موافقین ۰ مخالفین ۰
احمد

منبع باز یا اوپن سورس (Open source) چه مفهومی دارد؟

منبع باز ، اوپن سورس یا به عبارتی Open source که گاها از آن به عنوان متن باز نیز یاد می شود واژه ای است که نشان می دهد که یک محصول اجازه استفاده از کد منبع , اسناد طراحی یا محتوای خود را به دیگران می دهد.

ادامه مطلب...
۲۴ خرداد ۰۲ ، ۲۲:۲۹ ۰ نظر موافقین ۰ مخالفین ۰
احمد