Semalt: چگونه می توان با استفاده از برنامه افزودنی Google Chrome یک صفحه وب را خراش داد

اسکرابر صفحه نمایش اسکریپتی است که سایت ها را می خواند و اطلاعات مفیدی را از وب استخراج می کند. scrap کردن صفحه نمایش راه حل نهایی برای دریافت داده های واقعی از وب سایت ها و صفحات وب به Microsoft Excel است. Google Chrome Extension Scraper ابزاری قدرتمند برای خراش دادن صفحه است که هم در ویندوز و هم برای Mac OS کار می کند.

چرا Google Chrome Extension Scraper؟

ضایعات افزونه Google Chrome ابزاری برای خراش دادن صفحه به صورت رایگان در فروشگاه وب Chrome است. این ابزار scraping به عنوان افزونه در مرورگر Chrome نصب شده است. این افزونه به وبلاگ نویسان و بازاریابان اجازه می دهد تا داده ها را از طریق صفحات وب با کلیک راست بر روی یک عنصر بازیابی کنند. در صورت کلیک راست روی یک عنصر ، "" Scrape Same "باید روی صفحه نمایش ظاهر شود.

آشنایی با XPaths

XPath یک زبان برنامه نویسی است که برای یافتن اطلاعات مهم در ساختار XML استفاده می شود. فایل HTML نمونه ای عالی از ساختار XML است. XPath معمولاً برای انتخاب گره های هدفمند استفاده می شود. در این زمینه از XPaths برای تعیین متن استخراج شده در یک صفحه وب استفاده خواهد شد. XPaths همچنین به شناسایی نام احزاب و شماره تلفن نمایندگان مجلس سوئد کمک خواهد کرد.

برای دسترسی به جزئیات آدرس 349 نماینده سوئدی از Google Scraper استفاده کنید

با Chrome Scraper ، استخراج اطلاعات از یک صفحه وب نه تنها ساده بلکه فوق العاده است. شما از روند و تکنیک خود لذت خواهید برد.

این وب سایت کلیه اعضای سوئدی و آدرس آنها را لیست می کند. برای شروع ، بر روی هر MP کلیک راست کرده و "Scrape Same" را انتخاب کنید. باید نمایشگر زیر را روی صفحه خود مشاهده کنید.

راهنمای گام به گام نحوه نمایش صفحه وب scrape

اگر بر روی یک MP کلیک راست کرده و گزینه "Inspect element" را انتخاب کنید ، یک لیست الفبایی در زیر کلاس "" grid_6 alpha omega search result resultlistlist "ایجاد می شود. برای ترسیم این صفحه وب دو مرحله استفاده خواهد شد. گام دوم شامل انتخاب قسمتهای خاص از داده ها مانند نام مهمانی ها ، نام ها و شماره تلفن و سازماندهی داده ها در ستون ها می باشد.

مرحله 1

عمیق تر درون ساختار HTML حفر کنید و عناصر را دست نخورده نگه دارید. برچسب ها را نشان دهید تا تعداد برچسب های مربوط به عناصر موجود در ساختار خود را مشخص کنید. آخرین برچسب موجود از داده های هدفمند را شناسایی کنید. با کلیک بر روی "خراشیدن" ، یک تست XPath روی ساختار را اجرا کنید.

لیستی از 349 ردیف روی صفحه نمایش شما نمایش داده می شود. 349 نماینده کل نمایندگان مجلس سوئد است.

گام 2

داده های ارائه شده را در ستون ها تقسیم کنید. کد HTML را در صفحه وب مورد استفاده خود بررسی کنید. در این حالت ، قطعاتی که باید استخراج شوند در این لحظه با رنگ زرد برجسته می شوند. XPath ها را در قسمت ستون های ایجاد شده وارد کنید و روی "Scrape" کلیک کنید تا افزونه اجرا شود.

اگر دانش پایه ای در مورد XPaths داشته باشید ، درک برنامه نویسی برای شما کاری اساسی نخواهد بود. مراحل فوق برجسته شما را در مورد نحوه نمایش صفحه وب خراش راهنمایی می کند. اگر می خواهید چندین صفحه وب را ضبط کنید ، باید مهارت برنامه نویسی داشته باشید.

mass gmail