বাংলা ওসিআর

বাংলা ওসিআর – Bangla OCR

বাংলা ওসিআর (Bengali OCR বা Bangla OCR) অর্থাৎ বাংলা অপটিক্যাল ক্যারেক্টার রিডার (Bengali OCR বা Bangla OCR/ Optical character recognition.

পিডিএফ বা কোনো ইমেজ ফাইলে বাংলা লেখাকে ইউনিকোড বাংলায় রূপান্তরিত করার সিস্টেম। ফলে এখন আর পেজ ধরে ধরে বাংলায় টাইপ করার দরকার নেই। এই সিস্টেমে বাংলা টাইপ হয়ে যাচ্ছে স্বয়ংক্রিয় ভাবে। কিন্তু এই সিস্টেম এখনো ১০০% নির্ভুল নয়। এতে প্রচুর বানান ভুল বের হচ্ছে, এবং আরো অন্যান্য ফরম্যাটিং সমস্যা থেকে যাচ্ছে। তাই যা করতে হচ্ছে সেটা হলো, লেখা ধরে ধরে পড়তে হবে, এবং ভুল-ত্রুটি সংশোধন করতে হবে। অনেকটা ‘প্রুফ-রিড’ করার মত। তবেই সেগুলো পাঠের যোগ্য হবে। বড় বড় বইগুলো আপাতত এভাবে বাংলায় করে তারপর ধীরে ধীরে সংশোধন করে নিলেই আমরা অনলাইনে বাংলা ভাষা আরো অনেক সমৃদ্ধ হবে।

আমরা এরকম বড় কাজগুলো ওসিআর-এর মাধ্যমে করে আপলোড করে দেব। আপনারা কেউ চাইলে সেগুলো সংশোধন করে আমাদেরকে সাহায্য করতে পারেন। আমরা তখন সংশোধিত অংশটুকু পুনরায় আপলোড করে দেব।


এরকম কিছু প্রজেক্ট-এর লিস্ট এখানে রাখা হবে। আগ্রহীরা এই পাতায় নজর রাখতে পারেন।

  1. আল-বিদায়া ওয়ান নিহায়া