HƯỚNG DẪN OCR TRANSLATOR

OCR Translator trong Transifyr hoạt động như thế nào?

Dùng Native OCR, Tesseract.js, Auto fallback, Screenshot OCR và Live OCR đúng cách đềEnhận diện chữ sạch hơn và dịch nhanh hơn.

OCR dùng đềElàm gì?

OCR chuyển chữ nằm trong vùng màn hình, ảnh chụp, game, phụ đềEvideo, slide hoặc PDF thành văn bản có thềExử lý. Sau đó Transifyr đưa văn bản này vào engine dịch bạn đã chọn.

Thứ tự ưu tiên của OCR Engine

Transifyr có ba chế đềEOCR Engine. Mặc định tốt nhất là Auto vì cân bằng giữa tốc đềEvà đềEtin cậy.

1

Auto: thử Native OCR trước. Nếu kết quả rỗng, nhiềE hoặc không đáng tin cậy, app sẽ fallback sang Tesseract.js.

2

Native OCR: chềEdùng Windows OCR. Phù hợp khi cần tốc đềEcao với chữ rõ, nền trắng hoặc giao diện app sạch.

3

Tesseract.js: bềEqua Native OCR và chềEdùng Tesseract. Hữu ích khi Native OCR đọc kém trên nền video nhiều màu hoặc phụ đềEstylized.

OCR language đi theo Screenshot Source Language

Transifyr không dùng setting OCR Language riêng. OCR lấy Screenshot Source Language làm hint nhận diện, giúp ngôn ngữ OCR và ngôn ngữ nguồn khi dịch luôn khớp nhau.

  • Screenshot Source = English ↁETesseract dùng eng.
  • Screenshot Source = Japanese ↁETesseract dùng jpn+eng.
  • Screenshot Source = Korean ↁETesseract dùng kor+eng.
  • Screenshot Source = Chinese ↁETesseract dùng chi_sim+eng.
  • Screenshot Source = Auto ↁETesseract dùng default nhẹ, hiện là jpn+eng.

jpn+eng nghĩa là gì?

jpn+eng nghĩa là Tesseract tải cùng lúc bềEnhận diện tiếng Nhật và tiếng Anh. Cách này hữu ích với phụ đềENhật có lẫn tên riêng, UI label, sềEhoặc thuật ngữ game bằng tiếng Anh.

Cấu hình khuyến nghềE/h2>
1

Đặt OCR EngineAuto.

2

Đặt Screenshot Source Language đúng với ngôn ngữ chữ trong ảnh hoặc phụ đềE

3

Đặt Target Language là ngôn ngữ bạn muốn đọc.

4

Dùng Screenshot OCR hoặc Live OCR đềEdịch vùng màn hình đã chọn.

Khi OCR nhận diện chưa chính xác

  • Chọn vùng nhềEhơn, chềEchứa khu vực phụ đềEhoặc chữ cần đọc.
  • Đặt Screenshot Source Language thủ công thay vì Auto.
  • Thử Tesseract.js nếu nền video nhiều màu, chuyển động hoặc phụ đềEstylized.
  • Thử Native OCR nếu đang đọc UI app, tài liệu hoặc nền trắng rõ chữ.
  • Nới vùng chọn một chút nếu chữ bềEcắt mất nét.

Câu hỏi thường gặp

Nên chọn Native OCR hay Tesseract.js?

Hãy dùng Auto trước. Native OCR nhanh hơn với chữ rõ. Tesseract.js hữu ích hơn khi nền video nhiều màu, phụ đềEstylized hoặc Native OCR đọc sai.

Vì sao OCR language đi theo Screenshot Source Language?

Cách này tránh cấu hình mâu thuẫn. Ngôn ngữ dùng đềEnhận diện chữ thường nên trùng với ngôn ngữ nguồn dùng đềEdịch.

Live OCR có dùng cùng OCR settings không?

Có. Live OCR dùng OCR Engine và Screenshot Source Language làm hint nhận diện chữ.