پروژه : پروژه استخراج اطلاعات از پیج های زیر مجموعه یک سایت و ثبت در اکسل

من نیاز دارم اطلاعات مورد نظر از نمادهای مختف بورس اوراق بهادار تهران رو از صفحات زیر مجموعه سایت سازمان بورس http://www.tsetmc.com استخراج و جمع آوری کنم و خروجی در یک فایل اکسل ثبت بشه.
برخی اطلاعات باید از صفحات html استخراج بشه و برخی از هم از طریق خدمات وب خود سایت و اتصال مستقیم به سرور قابلیت درخواست داره. نحوه گرفتن اطلاعات به انتخاب برنامه نویس هست و من فقط میخوام اطلاعات مورد نظر ثبت بشه.
لازم دارم کد اپن سورس و ساده و یوزر فرند باشه تا اگر تغییراتی لازم بود انجام بشه رو حتی المقدرو خودم بتونم بعدا انجام بدم.
استخراج اطلاعات در دو بخش خواهد بود. بخش اول و ساده تر کار استخراج اطلاعات تاریخچه مثلا 60 روز گذشته و ثبت اونها در فایل اکسل مورد نظر هست. این قسمت فقط با یکبار فراخوانی کد انجام میشه و چون اطلاعات مربوط به گذشته بازار هست سرعت عمل و ... اهمیت زیادی نداره. لازم به ذکر هست که خود سایت عمده اطلاعات مورد نظر رو با انتخاب تاریخ روز مد نظر در هر بار درخواست در قالب فایل اکسل و فرمت های دیگه ارایه میده و برنامه نویس میتونه با کدنویسی از همین قابلیت سایت استفاده کنه و اطلاعات مثلا 60 روز رو در یک روال تکراری جمع آوری و در یک فایل همه رو کنار هم و با فرمت مناسبی که توافق میشه ثبت کنه. اما بخشی از اطلاعات مورد نیاز در فایل خروجی سایت نیست و باید از جداگانه از صفحات نمادها در تاریخ مورد نظر و یا خدمات وب سرویس سایت مجددا فراخوانی و ثبت بشه و به فایل قبلی اضافه بشه. لازم به توجه هست برنامه نویس مختار هست از هر روش و روالی که خودش مناسب میدونه اطلاعات رو فراخوانی و ثبت کنه و مواردی که گفته شد صرفا پیشنهادات من هست.
بخش دوم کار هم ثبت اطلاعات روز جاری در ساعات معاملاتی و به صورت تقریبا آنلاین هست. در این بخش لازم دارم که اطلاعات مورد نظر از صفحه هر نماد در هر لحظه در فایل ثبت بشه. در این بخش چون در حین معاملات روزانه از ساعت 8:30 تا 12:30 ظهر انجام میشه سرعت عمل و امکان ثبت اطلاعات تقریبا به صورت آنلاین (تاخیر تا حداکثر یکی دو دقیقه هم قابل قبوله) مورد نیاز هست.

اگر سوالی داشتید برای پاسخگویی آماده هستم.