OCR
(Optical Character Recognition) merupakan sebuah teknologi yang dapat
membaca dan mengenali teks dari suatu gambar. Gambar yang dimaksud
biasanya berupa hasil scan yang mengandung teks, tentunya teks di
dalamnya tidak bisa di olah atau di edit karena masih berupa format
gambar. Dengan OCR, teks dalam gambar tersebut dapat di ubah menjadi
teks yang bisa di olah kembali.
Dengan OCR, pekerjaan mengetik dokumen dapat benar-benar di mudahkan.
Cukup scan dokumen yang tadinya mau di ketik lalu buka hasil scan dengan
software OCR. Dan teks di dalamnya langsung dapat digunakan, entah
untuk di edit atau di olah kembali tanpa harus mengetik dari awal sampai
akhir.
Salah satu software OCR yang lumayan bagus adalah Simple OCR, software
inilah yang digunakan dalam artikel Komputok kali ini. Meskipun
keakuratan pengenalan karakternya bukan yang terbaik, namun fasilitas
editing yang disediakan olehnya sangat membantu untuk mengoreksi
kata-kata yang salah secara manual.
Selain itu, Simple OCR juga dilengkapi dengan kamus kata, dia akan
menebak kata yang agak sulit di baca dengan kata yang paling mendekati
di kamusnya. Namun, hanya efektif untuk tulisan yang berbahasa inggris,
karena isi kamusnya masih berbahasa inggris.
- Download software Simple OCR di http://www.simpleocr.com/Download.asp dengan ukuran sekitar 9 MB, lalu instal seperti biasa.
- Setelah selesai di instal, jalankan simple OCR. Akan muncul pilihan, apakah mau Machine Print, yaitu hasil ketikan komputer atau hand writing, yakni tulisan tangan. Hand writing apabila ingin mengubah tulisan tangan menjadi teks di komputer, namun penggunaannya dibatasi 14 hari saja, selebihnya bayar. Karena yang akan kita gunakan kali ini adalah teks hasil ketikan komputer, maka klik Machine Print.
- Di jendela selanjutnya, pilih [Select]. Setelah itu, jendela utama
Simple OCR akan muncul. Untuk memulai, klik [add page] Akan terdapat
beberapa pilihan, apakah mau langsung dari scanner, file, Batch(untuk
halaman dalam jumlah banyak sekaligus), atau membuka file dengan format
inklink. Pilih sesuai kebutuhan, namun dalam tutorial kali ini, yang
dipilih adalah [file], dengan asumsi, file yang akan di akan di baca
sudah ada sebelumnya, lalu klik ok.
- Buka file gambar yang akan di baca. Sebelumnya, pastikan file yang
akan di baca memiliki teks yang mudah di baca dan memiliki resolusi
tinggi, semakin tinggi, maka semakin mudah simple OCR mengenali teks di
dalamnya. Rata-rata resolusi hasil scan scanner sudah mencukupi untuk
dilakukan pembacaan.
- Setelah di pilih, maka akan di tampilkan preview gambarnya, bila
sudah yakin gambar tersebut yang mau di baca , klik [continue].
- Selanjutnya, lakukan editing gambar yang akan di baca. Untuk
memisahkan teks dengan gambar, gunakan icon picture region untuk
menyeleksi gambarnya , mengabaikan area tertentu agar sofware tidak
membacanya, gunakan ignore region {icon_1.bmp} atau menghapus area
tertentu, gunakan delete region { Ketiga tool tersebut ada di toolbar
Simple OCR. Setelah yakin semua sudah di edit dengan baik, klik [convert
to text]. Simple OCR akan membaca dan mengenali semua teks dalam gambar
dan menampilkan teks hasil pembacaannya.
- Dalam proses pembacaan, Simple OCR mungkin akan salah membaca
beberapa teks. Dapat disebabkan karena memang teks tersebut agak sulit
terbaca atau resolusinya kurang baik. Karena itu, tugas terakhir kita
adalah mengoreksinya. Editornya langsung dari simple OCR, sederhana,
efektif dan mudah digunakan.
- Warna huruf menandakan tingkat akurasi kata yang di koreksi, warna hitam artinya kata sudah akurat. Biru, artinya mendekati akurat dan warna merah artinya perlu di koreksi lagi. Gunakan tombol enter untuk berpindah dari kata ke kata lainnya, dan bandingkan kata yang sedang di edit dengan kata yang masih dalam format gambar di atasnya.
- Apabila semua kata sudah di koreksi, save teks hasil pembacaan tadi di format doc atau txt.
Proses ini hanya membutuhkan waktu sebentar, tergantung dari banyaknya
revisi yang harus dilakukan, tentunya jauh lebih singkat bila
dibandingkan mengetik sendiri secara manual. Pekerjaan mengetik dapat di
hindari untuk bisa mengerjakan pekerjaan lain yang lebih penting.
Selain Simple OCR, masih banyak software-software OCR lain yang bisa digunakan secara gratis :
Tidak hanya software, ada juga website yang menyediakan fasilitas OCR.
Tidak perlu instal atau registrasi apapun, tinggal kunjungi dan upload
gambarnya. Website tersebut diantaranya :
Alternatif lain, jika ingin menghemat waktu, MS Office OneNote 2007
juga menyediakan fasilitas OCR. Cara pakainya tinggal buka file
gambarnya di OneNote, klik kanan, lalu pilih “copy text from picture”,
lalu paste di teks editor seperti Word, atau notepad. Hanya saja,
fasilitas yang disediakan tidak sebanyak softwae OCR lainnya.





Tidak ada komentar:
Posting Komentar