در بیشتر پروژههای Web Scraping (استخراج اطلاعات از لابلای صفحات وب) نیاز به login به وبسایت حاوی اطلاعات هست. برای آن که کسی بتواند به یک وب سایت لاگین کند باید با روشهای Authentication و حفظ State در تکنولوژیهای مختلف مثل ASP.NET و PHP آشنا باشد. روش Login در ASP.NET مبتنی بر ارسال اطلاعات login …
ماه: نوامبر 2011
git-dot-aspx * مشکلی با فایلهای حجیم ندارد. فقط کافی است http.postBuffer و maxRequestLength تنظیم شود.* لازم نیست که حتماً repoها توسط خودش ایجاد شده باشد. اگر یک repo را در مسیر repoهایش قرار دهید میتوانید از آن استفاده کنید.* اینترفیس وبی آن فقط فهرست repoها و comment آخرین تغییر را نشان میدهد نه هیچ اطلاعات …
تا همین چند وقت پیش برای ایجاد یک git server در ویندوز مجبور بودید از راه حلهای لینوکسی مثل OpenSSH و cygwin استفاده کنید. استفاده از این طور راه حلها واقعاً سخت و عذاب آور بود و گاهی اوقات باعث میشد شخص قید git server ویندوزی را بزند و به سراغ گزینههای دیگری مثل مرکوری …
فکر میکنید سختترین قسمت Data Scrapping چیست؟ ایجاد آبجکت request و ارسال آن به سرور؟حفظ ViewState؟login کردن به سایت راه دور؟دریافت و نگهداری cookie؟مسائل DNS؟ور رفتن با استرینگها، استخراج دیتا، Regex و XPath؟مسائل Encoding؟ نه اشتباه میکنید! برای من سختترین قسمت کار، بحث Stream بود. چند جا کار متوقف شد. ابتدا فکر کردم مشکل از …