زمانیکه قرار است با فایلهای باینری واقع در سمت سرور کار کنیم، اگر اکشن متدهای ارائه دهندهی آنها محافظت شده نباشند، برای نمایش و یا دریافت آنها تنها کافی است از آدرس مستقیم این منابع استفاده کرد و در این حالت نیازی به رعایت هیچ نکتهی خاصی نیست. اما اگر اکشن متدی در سمت سرور توسط فیلتر Authorize محافظت شده باشد و روش محافظت نیز مبتنی بر کوکیها نباشد، یعنی این کوکیها در طی درخواستهای مختلف، به صورت خودکار توسط مرورگر به سمت سرور ارسال ...
یکی از متداولترین کارهایی که با اسناد میتوان انجام داد، تهیه خروجی pdf از word و پر کردن یک فایل word با مقادیر ورودی است که سعی داریم یک نمونه از آن را اینجا بررسی کنیم. کد عمومی برای جایگزین کردن: public void MsInteropReplace(Microsoft.Office.Interop.Word.Application doc, object findText, object replaceWithText)
{
object matchCase = false;
object matchWholeWord = true;
object ma ...
ویندوز 8.1 دارای امکانات و API توکاری جهت نمایش و خواندن فایلهای PDF در برنامههای مترو است. در ادامه قصد داریم از این امکانات در یک برنامهی متداول دات نت، برای مثال یک برنامهی کنسول غیر مترو استفاده کنیم.
آماده سازی برنامههای دات نت برای دسترسی به API مترو ویندوز 8.1
ابتدا یک برنامهی کنسول دات نت 4.5.1 را آغاز کنید. برای دسترسی به API ویندوز 8.1 حتما نیاز است که حداقل از دات نت 4.5.1 شروع کرد. سپس برنام ...
پیشتر مطلبی را در مورد « تبدیل HTML به PDF با استفاده از کتابخانهی iTextSharp » در این سایت مطالعه کردهاید. این مطلب از افزونه HTMLWorker کتابخانه iTextSharp استفاده میکند که ... مدتی است توسط نویسندگان این مجموعه منسوخ شده اعلام گردیده و دیگر پشتیبانی نمیشود.
کتابخانه جایگزین آنرا افزونه XMLWorker معرفی کردهاند که توانایی پردازش CSS و HTML بهتر و کاملتری را نسبت به HTMLWorker ارائه میدهد. این کتابخانه ...
در مطلبی که در همین سایت اشاره شد با استفاده
از Adobe Acrobat میتوان فایلهای pdf را به تصویر تبدیل کرد اما چون نیاز بود تا در
وب از آن استفاده کنیم و گاهی اوقات امکان نصب Adobe Acrobat Sdk در
سرور وجود ندارد میتوان از روش زیر نیز استفاده کرد.ابتدا فایل gsdll32.dll را
در پوشه bin پروژه کپی کنید ( این فایل به همراه مثال ارائه
شده وجود دارد).سپس برای متدهای موردنیاز موجود در Api که
بصورت Unmanaged میباشند یکسری wrapper
ای ...
عموما در برنامههای وب برای نمایش فایلهای پویای باینری تولید شده، یا ابتدا آنها را بر روی سخت دیسک ذخیره کرده و مسیر نهایی را به نحوی به کاربر نمایش میدهند و یا فایل را بدون ذخیره سازی، در مرورگر کاربر اصطلاحا Flush میکنند. حالت Flush سبب نمایش صفحه دیالوگ ذخیره سازی فایل گردیده و در همینجا Response خاتمه خواهد یافت.
برای نمونه در اینجا توسط متد inMemoryFile، یک فایل PDF در حافظه تشکیل شده و سپس به صورت یک Byte Array بازگشت دا ...
فرض کنید تعداد زیادی فایل PDF را با اسامی نامفهومی داریم. برای نظم بخشیدن و یافتن سادهتر مطالب شاید بهتر باشد این فایلها را بر اساس عنوان اصلی ذخیره شده در فایل، تغییر نام دهیم.
امکان خواندن meta data فوق (البته در صورت وجود)، توسط iTextSharp وجود دارد. در ادامه قطعه کد سادهای را ملاحظه میکنید که در یک پوشه، تمام فایلهای PDF را یافته و بر اساس Title یا Subject آنها، فای ...
پیشنیاز
نحوه ذخیره شدن متن در فایلهای PDF
حتما نیاز است پیشنیاز فوق را یکبار مطالعه کنید تا علت خروجیهای متفاوتی را که در ادامه ملاحظه خواهید نمود، بهتر مشخص شوند. همچنین فایل PDF ایی که مورد بررسی قرار خواهد گرفت، همان فایلی است که توسط متد writePdf ذکر شده در پیشنیاز تهیه شده است.
دو کلاس متفاوت برای استخراج متن از فایلهای PDF در iTextSharp وجود دارند:
الف) SimpleTextExtractionStrategy
...
تبدیل بی عیب و نقص یک فایل PDF (انواع و اقسام آنها) به متن قابل درک بسیار مشکل است. در ادامه بررسی خواهیم کرد که چرا.
برخلاف تصور عموم، ساختار یک صفحه PDF شبیه به یک صفحه فایل Word نیست. این صفحات درحقیقت نوعی Canvas برای نقاشی هستند. در این بوم نقاشی، شکل، تصویر، متن و غیره در مختصات خاصی قرار خواهند گرفت. حتی کلمه «متن» میتواند به صورت سه حرف در سه مختصات خاص یک صفحه PDF نقاشی شود. برای درک بهتر این مورد نیاز است سورس یک صفح ...