تبدیل PDF فارسی به متن با استفاده از چند ابزار لینوکسی و کمی پایتون
مشکل اینجاست که در ایمکس فونت سراسریام متن فارسی را به صورت جدا جدا نشان میدهد. ولی طبق روشی که به آن اشاره کردم، کاراکترهایی که در رنج خاصی از کدهای یونیکد هستند، باید با فونت Tahoma (انتخاب من) نمایش داده شوند. اما وقتی فایل خروجی Okular را...
fa.shahin.blog6 min read