توسط ماژولها میتوانیم یک مجموعه از دستورات را گروهبندی کنیم و تحت عنوان یک پکیج ارائه دهیم که برای دیگران نیز قابل استفاده باشند. برای ایجاد یک ماژول کافی است اسکریپتهای خود را درون یک فایل با پسوند psm1 قرار دهیم؛ به این فایل اصطلاحاً root module گفته میشود. در واقع میتوان گفت ماژولها یک روش مناسب برای به اشتراکگذاری اسکریپتها میباشند. تا اینجا با کمک پروفایلها توانستیم امکان استفاده مجدد از توابع و اسکریپتها را داشته باشیم؛ ماژول ...
فرض کنید که میخواهید برای کاربری پس از ثبت اطلاعاتش در سایت، کارتی به فرمت PDF صادر کنید تا آن را دریافت و سپس چاپ کند. حتما از این دست موارد زیاد مشاهده کرده اید؛ مانند دریافت کارت ورود به جلسات امتحانی، کارت ورود به همایشها و کنسرتهای موسیقی و ... برای تهیه فایل PDF، به غیر از کتابخانههای گزارش گیری تجاری، میتوان از کتابخانهی iTextSharp که گزینهای سورس باز، با کیفیت و محبوب است، استفاده کرد. متاسفانه این کتابخانه دارای محیط ...
کتابخانه iTextSharp کتابخانهای بسیار قوی و معروف، جهت کار با فایلهای pdf میباشد. کارهایی از قبیل ساخت و ویرایش و تبدیل فایلهای pdf با این کتابخانه قدرتمند به راحتی محیا است. گاهی نیاز داریم تا اطلاعاتی را از داخل یک فایل pdf استخراج کنیم. ما الان میخواهیم کل تصاویر موجود در یک فایل pdf را استخراج کنیم. ابتدا باید فایل pdf را باز کنیم. با استفاده از کلاس PdfReader اینکار امکان پذیر میشود. سپس باید تعداد کل صفحات را خوانده و بر روی آ ...
پیشتر مطلب « تهیه پردازندههای سفارشی برای HTMLWorker کتابخانه iTextSharp » را در این سایت مطالعه کردهاید. از آنجائیکه افزونه HTMLWorker منسوخ شده است و دیگر پشتیبانی نخواهد شد، باید کدهای فعلی را به افزونه XMLWorker منتقل کرد. مقدمهای را در این زمینه در مطلب « تبدیل HTML فارسی به PDF با استفاده از افزونهی XMLWorker کتابخانهی iTextSharp » میتوانید مطالعه نمائید.
در ادامه قصد داریم همان امکان پشتیبانی از تصاویر base64 مدفون ...
پیشتر مطلبی را در مورد « تبدیل HTML به PDF با استفاده از کتابخانهی iTextSharp » در این سایت مطالعه کردهاید. این مطلب از افزونه HTMLWorker کتابخانه iTextSharp استفاده میکند که ... مدتی است توسط نویسندگان این مجموعه منسوخ شده اعلام گردیده و دیگر پشتیبانی نمیشود.
کتابخانه جایگزین آنرا افزونه XMLWorker معرفی کردهاند که توانایی پردازش CSS و HTML بهتر و کاملتری را نسبت به HTMLWorker ارائه میدهد. این کتابخانه ...
شاید یک سری از Ebookهای PDF ایی را دیده باشید که سایتهای ثالث، آنها را پس از افزودن لایهای متنی، مثلا در ذیل تمام صفحات به همراه آدرس وب سایت خودشان، باز انتشار میدهند. در مطلب جاری قصد داریم، نحوه حذف این لایههای اضافی را توسط iTextSharp بررسی کنیم.
یافتن و حذف لایههای اضافه شده به صفحات یک فایل PDF
برای آشنایی با ساختار سطح پایین لایههای اضافه شده نیاز است به برنامه iText Rups مراجعه کنیم.
همانطور که مشاهده م ...
احتمالا بارها با PDFهایی که یک Watermark بزرگ را در میانه صفحات خود دارند، برخورد داشتهاید و متاسفانه در اغلب اوقات استفاده ناصحیحی از این قابلیت صورت میگیرد. هدف از Watermark دار کردن صفحات PDF، ذکر جملاتی مانند «آزمایشی بودن» یا «محرمانه بودن» است که در هر دو حالت نباید به صورت عمومی منتشر شوند. اما اگر قرار است مطلبی را به صورت عمومی منتشر کنیم، این روش، بدترین حالت تبلیغی برای یک شخص یا شرکت خواهد بود؛ چون مانع خواندن روان متن شده و ...
فرض کنید تعداد زیادی فایل PDF را با اسامی نامفهومی داریم. برای نظم بخشیدن و یافتن سادهتر مطالب شاید بهتر باشد این فایلها را بر اساس عنوان اصلی ذخیره شده در فایل، تغییر نام دهیم.
امکان خواندن meta data فوق (البته در صورت وجود)، توسط iTextSharp وجود دارد. در ادامه قطعه کد سادهای را ملاحظه میکنید که در یک پوشه، تمام فایلهای PDF را یافته و بر اساس Title یا Subject آنها، فای ...
پیشنیاز
نحوه ذخیره شدن متن در فایلهای PDF
حتما نیاز است پیشنیاز فوق را یکبار مطالعه کنید تا علت خروجیهای متفاوتی را که در ادامه ملاحظه خواهید نمود، بهتر مشخص شوند. همچنین فایل PDF ایی که مورد بررسی قرار خواهد گرفت، همان فایلی است که توسط متد writePdf ذکر شده در پیشنیاز تهیه شده است.
دو کلاس متفاوت برای استخراج متن از فایلهای PDF در iTextSharp وجود دارند:
الف) SimpleTextExtractionStrategy
...