# Hướng dẫn OCR của Noterich: Scan ghi chú giấy thành văn bản kỹ thuật số > Hãy chuyển đổi các ghi chú viết tay, tài liệu in và tài liệu giấy thành văn bản kỹ thuật số có thể chỉnh sửa bằng chức năng OCR tích hợp trong Noterich. --- ## Giới thiệu Trong thời đại kỹ thuật số ngày nay, nhiều người chúng ta vẫn còn sử dụng ghi chú giấy, tài liệu in và tài liệu viết tay. **Noterich** giúp kết nối giữa vật lý và kỹ thuật số với chức năng OCR mạnh mẽ của nó, được gọi là **“Note Scanner”**. ### Tại sao nên sử dụng OCR của Noterich? - ✨ **Chuyển đổi ngay lập tức**: Chuyển đổi ghi chú giấy thành văn bản có thể chỉnh sửa trong vài giây - 🎯 **Độ chính xác cao**: Bộ máy nhận diện AI tiên tiến - 📱 **Dễ sử dụng**: Giao diện tải dễ dàng với chức năng kéo và thả - 🔒 **An toàn về quyền riêng tư**: Xử lý tài liệu một cách an toàn - 📝 **Tích hợp liền mạch**: Thêm văn bản nhận diện trực tiếp vào ghi chú của bạn ```mermaid flowchart TD A[📄 Ghi chú giấy] --> B[📷 Chụp ảnh] B --> C[🤖 Xử lý OCR] C --> D[📝 Văn bản kỹ thuật số có thể chỉnh sửa] D --> E[💾 Lưu vào Noterich] style A fill:#e3f2fd style B fill:#fff3e0 style C fill:#f3e5f5 style D fill:#e8f5e9 style E fill:#ffebee ``` --- ## Bắt đầu với OCR ### Điều kiện cần Trước khi bắt đầu, hãy đảm bảo rằng bạn có: 1. **Tài khoản Noterich**: Truy cập vào trình soạn thảo trực tuyến của Noterich 2. **Tệp hình ảnh**: Một bức ảnh hoặc bản scan của tài liệu của bạn (JPG, PNG, v.v.) 3. **Trình duyệt hiện đại**: Chrome, Firefox, Safari, hoặc Edge ### Định dạng hình ảnh hỗ trợ | Định dạng | Phụ lục | Kích thước tối đa | |--------|-----------|----------| | JPEG | `.jpg`, `.jpeg` | Được khuyến nghị | | PNG | `.png` | Được khuyến nghị | | WebP | `.webp` | Hỗ trợ | | GIF | `.gif` | Hỗ trợ | > 💡 **Mẹo**: Để đạt kết quả tốt nhất, hãy sử dụng hình ảnh có độ phân giải cao (ít nhất 300 DPI khi quét). --- ## Hướng dẫn từng bước ### Bước 1: Mở Trợ lý AI 1. Điều hướng đến trình soạn thảo của Noterich 2. Nhấp vào nút **Trợ lý AI** trên thanh công cụ 3. Hộp thoại AI sẽ mở ra với hai tùy chọn ```mermaid graph LR A[Thanh công cụ] --> B[Nút Trợ lý AI] B --> C[Hộp thoại AI mở ra] C --> D[Chọn chế độ] D --> E[AI Chung] D --> F[OCR Note Scanner] style F fill:#bbdefb ``` ### Bước 2: Chọn chế độ Note Scanner Trong hộp thoại Trợ lý AI, bạn sẽ thấy hai tùy chọn: - **AI Chung**: Dành cho sự hỗ trợ AI dựa trên văn bản - **Note Scanner** 📷: Dành cho xử lý hình ảnh OCR Nhấp vào **Note Scanner** để chuyển sang chế độ OCR. ### Bước 3: Tải lên hình ảnh của bạn Bạn có hai cách để thêm hình ảnh tài liệu của mình: #### Tùy chọn A: Nhấp để tải lên 1. Nhấp vào khu vực tải với biểu tượng máy ảnh 📷 2. Truy cập các tệp và chọn hình ảnh 3. Hình ảnh sẽ được tải lên và hiển thị dưới dạng bản xem trước #### Tùy chọn B: Kéo và thả 1. Chỉ cần kéo tệp hình ảnh từ máy tính của bạn 2. Thả nó vào khu vực tải 3. Buông ra để tải tự động ```svg <svg viewBox="0 0 200 120" xmlns="http://www.w3.org/2000/svg"> <rect x="10" y="10" width="180" height="100" rx="8" fill="#f0f4f8" stroke="#cbd5e1" stroke-width="2" stroke-dasharray="8,4"/> <text x="100" y="45" text-anchor="middle" font-size="32">📷</text> <text x="100" y="70" text-anchor="middle" font-size="12" fill="#64748b">Nhấp hoặc kéo hình ảnh</text> <text x="100" y="85" text-anchor="middle" font-size="12" fill="#64748b">để quét ghi chú</text> <rect x="60" y="95" width="80" height="4" rx="2" fill="#e2e8f0"/> </svg> ``` ### Bước 4: Xem trước và kiểm tra Sau khi tải lên, bạn sẽ thấy: - 🖼️ **Bản xem trước hình ảnh**: Bản thu nhỏ của tài liệu đã tải lên - ❌ **Nhấn nút xóa**: Nhấp để xóa và tải lên hình ảnh khác - ✅ **Trạng thái sẵn sàng**: Đơn vị “Generate” trở thành hoạt động ### Bước 5: Tạo văn bản kỹ thuật số 1. Nhấp vào **🚀 Generate** 2. Chờ xử lý OCR hoàn tất 3. Văn bản được nhận diện sẽ xuất hiện trong trình soạn thảo của bạn ### Bước 6: Xem lại và chỉnh sửa Kết quả OCR được chèn trực tiếp vào ghi chú của bạn. Bạn có thể: - ✏️ **Chỉnh sửa** bất kỳ lỗi nhận diện nào - 📐 **Định dạng** văn bản bằng công cụ định dạng văn bản phong phú của Noterich - 💾 **Lưu** ghi chú kỹ thuật số của bạn - 🔗 **Liên kết** với các ghi chú khác trong không gian làm việc của bạn --- ## Các nguyên tắc tốt nhất ### Hướng dẫn chất lượng hình ảnh Để đạt kết quả OCR tốt nhất, hãy tuân theo các khuyến nghị sau: ```mermaid quadrantChart title "Tác động của chất lượng hình ảnh đến độ chính xác của OCR" x-axis "Chất lượng thấp" --> "Chất lượng cao" y-axis "Kết quả kém" --> "Kết quả xuất sắc" "Ảnh mờ**: [0.2, 0.2] "Quét tối**: [0.3, 0.3] "Ảnh tốt**: [0.6, 0.7] "Quét chuyên nghiệp**: [0.9, 0.95] ``` ### Làm điều này ✅ - **Sử dụng ánh sáng tốt**: Đảm bảo ánh sáng đều, sáng - **Giữ cho phẳng**: Đặt tài liệu trên bề mặt phẳng - **Độ phân giải cao**: Hướng tới ít nhất 300 DPI - **Góc vuông**: Chụp từ phía trên trực tiếp - **Chú ý đến tầm nhìn**: Đảm bảo văn bản rõ ràng và dễ đọc - **Độ tương phản**: Văn bản tối trên nền sáng hoạt động tốt nhất ### Không làm điều này ❌ - **Tránh bóng tối**: Đừng để bóng tối trên tài liệu - **Không lệch**: Giữ máy ảnh song song với trang giấy - **Đừng cắt quá chặt**: Để lại chút khoảng cách xung quanh mép - **Tránh ánh sáng phản chiếu**: Chú ý đến phản chiếu trên giấy bóng - **Không có ánh sáng yếu**: Điều kiện ánh sáng yếu làm giảm độ chính xác --- ## Mẹo để đạt kết quả tốt hơn ### Ghi chú viết tay Nhận diện chữ viết tay có thể khó khăn. Cải thiện kết quả bằng cách: 1. **Viết rõ ràng**: Sử dụng chữ viết tay rõ ràng, nhất quán 2. **Sử dụng giấy có hàng**: Giúp giữ được đường thẳng 3. **Mực tối**: Mực xanh hoặc đen hoạt động tốt nhất 4. **Giữ khoảng cách đủ**: Để khoảng cách giữa các từ và dòng ### Tài liệu in Đối với tài liệu in: 1. **Sấy sạch hình ảnh**: Loại bỏ bụi và tạp chất trước khi quét 2. **Chữ phổ biến**: Chữ phổ biến được nhận diện tốt hơn 3. **Độ tương phản tốt**: Đảm bảo văn bản nổi bật so với nền 4. **Các trang đầy đủ**: Tránh cắt đi văn bản ở mép ### Cấu trúc phức tạp Khi xử lý các cấu trúc nhiều cột hoặc phức tạp: ```mermaid flowchart LR A[Tài liệu gốc] --> B[Loại cấu trúc] B --> C[Cột đơn] B --> D[Cột đa] B --> E[Với hình ảnh] C --> F[Xử lý OCR trực tiếp] D --> G[Xử lý từng cột] E --> H[Chỉ trích xuất văn bản] F --> I[✅ Kết quả tốt nhất] G --> J[⚠️ Có thể cần chỉnh sửa thủ công] H --> K[✅ Văn bản đã được trích xuất] style I fill:#c8e6c9 style J fill:#fff9c4 style K fill:#c8e6c9 ``` --- ## Hiểu về quá trình xử lý ### Điều gì xảy ra trong quá trình OCR? Khi bạn nhấp vào “Generate”, Noterich thực hiện một số bước: 1. **Xử lý hình ảnh trước**: Tối ưu hóa hình ảnh cho việc nhận diện - Sửa lỗi xoay tự động dựa trên metadata của máy ảnh - Tăng độ tương phản - Giảm nhiễu 2. **Nhận diện văn bản**: Xác định khu vực văn bản trong hình ảnh 3. **Nhận diện ký tự**: Chuyển đổi pixel hình ảnh thành ký tự văn bản 4. **Xử lý sau**: Định dạng và cấu trúc văn bản đầu ra 5. **Chèn vào**: Đặt kết quả trực tiếp vào trình soạn thảo của bạn ### Thời gian xử lý Thời gian xử lý thông thường phụ thuộc vào: | Yếu tố | Tác động | |--------|--------| | Kích thước hình ảnh | Lớn hơn = chậm hơn | | Số lượng văn bản | Nhiều văn bản = nhiều thời gian hơn | | Chất lượng hình ảnh | Kém chất lượng = xử lý thêm | | Tải server | Thời điểm cao có thể chậm hơn | **Thời gian trung bình**: 2-5 giây cho tài liệu tiêu chuẩn --- ## Câu hỏi thường gặp ### Câu hỏi chung **Q: Có giới hạn nào về số lượng hình ảnh tôi có thể xử lý không?** A: Noterich cung cấp giới hạn lớn cho việc xử lý OCR. Kiểm tra kế hoạch tài khoản của bạn để biết chi tiết cụ thể. **Q: Tôi có thể xử lý nhiều trang cùng lúc được không?** A: Hiện tại, chỉ xử lý một hình ảnh mỗi lần. Đối với tài liệu nhiều trang, hãy tải mỗi trang riêng biệt. **Q: Ngôn ngữ nào được hỗ trợ?** A: OCR của Noterich hỗ trợ nhiều ngôn ngữ chính, bao gồm tiếng Anh, Tây Ban Nha, Pháp, Đức, Trung Quốc, Nhật Bản, v.v. ### Câu hỏi kỹ thuật **Q: Nếu OCR mắc lỗi thì sao?** A: OCR không hoàn hảo. Luôn xem lại và chỉnh sửa kết quả. Hình ảnh gốc rõ ràng hơn, lỗi sẽ ít hơn. **Q: Tôi có thể xử lý văn bản viết tay được không?** A: Đúng! Nhận diện chữ viết tay được hỗ trợ, mặc dù văn bản in thường có độ chính xác cao hơn. **Q: Dữ liệu của tôi an toàn khi xử lý không?** A: Noterich ưu tiên quyền riêng tư. Tài liệu của bạn được xử lý an toàn và không được lưu trữ vĩnh viễn trên server. ### Khắc phục sự cố **Q: Đơn vị “Generate” bị vô hiệu hóa. Tại sao?** A: Hãy đảm bảo bạn đã tải lên hình ảnh. Chế độ OCR yêu cầu hình ảnh để xử lý. **Q: Kết quả đầu ra có vẻ lộn xộn. Sao lại như vậy?** A: Có thể do: - Chất lượng hình ảnh kém - Ngôn ngữ không được hỗ trợ - Chữ phông hoặc chữ viết rất đặc biệt - Thử tải lại hình ảnh rõ ràng hơn **Q: Xử lý mất quá nhiều thời gian. Tôi nên làm gì?** A: 1. Kiểm tra kết nối internet của bạn 2. Thử tải tệp hình ảnh nhỏ hơn 3. Chờ một lát và thử lại 4. Liên hệ hỗ trợ nếu vấn đề vẫn còn --- ## Tính năng nâng cao ### Tối ưu hóa hình ảnh Noterich tự động tối ưu hóa hình ảnh để đạt kết quả OCR tốt hơn: - **EXIF Hướng dẫn**: Điều chỉnh xoay tự động dựa trên metadata của máy ảnh - **Tối ưu hóa kích thước**: Độ phân giải lớn, giữ được độ rõ ràng của văn bản - **Chuyển đổi định dạng**: Chuyển đổi thành định dạng tối ưu cho xử lý ### Dòng chảy xử lý hàng loạt Để xử lý nhiều tài liệu một cách hiệu quả: ```mermaid gantt title Dòng chảy xử lý hàng loạt dateFormat X axisFormat %L section Chuẩn bị Thu thập tài liệu :0, 30 Thiết lập không gian làm việc :30, 60 section Xử lý Trang 1 OCR :60, 65 Trang 2 OCR :65, 70 Trang 3 OCR :70, 75 Xem lại và chỉnh sửa :75, 120 section Hoàn tất Định dạng và sắp xếp :120, 150 Lưu và sao lưu :150, 180 ``` --- ## Kết luận Tính năng OCR của Noterich biến cách bạn xử lý tài liệu giấy thành dễ dàng hơn. Dù bạn đang số hóa ghi chú cũ, chuyển đổi bài báo in, hay lưu trữ tài liệu quan trọng, Note Scanner giúp quá trình trở nên nhanh chóng và dễ dàng. ### Những điều quan trọng cần ghi nhớ - 🎯 **Chất lượng quan trọng**: Hình ảnh tốt hơn = kết quả tốt hơn - ⚡ **Xử lý nhanh**: Hầu hết tài liệu được xử lý trong vài giây - ✏️ **Luôn xem lại**: Chỉnh sửa kết quả để đạt độ chính xác tuyệt đối - 🔒 **An toàn**: Tài liệu của bạn được xử lý cẩn thận Hãy bắt đầu số hóa ghi chú giấy của bạn ngay hôm nay và trải nghiệm sức mạnh của OCR của Noterich! --- <div class="flex flex-wrap gap-2 mt-8 mb-12"> <span class="px-3 py-1 bg-[#f4f4f5] border border-[#eaeaea] rounded-full text-xs font-medium text-[#666]">OCR</span> <span class="px-3 py-1 bg-[#f4f4f5] border border-[#eaeaea] rounded-full text-xs font-medium text-[#666]">Note Scanner</span> <span class="px-3 py-1 bg-[#f4f4f5] border border-[#eaeaea] rounded-full text-xs font-medium text-[#666]">Số hóa tài liệu</span> <span class="px-3 py-1 bg-[#f4f4f5] border border-[#eaeaea] rounded-full text-xs font-medium text-[#666]">Trí tuệ nhân tạo</span> <span class="px-3 py-1 bg-[#f4f4f5] border border-[#eaeaea] rounded-full text-xs font-medium text-[#666]">Năng suất</span> <span class="px-3 py-1 bg-[#f4f4f5] border border-[#eaeaea] rounded-full text-xs font-medium text-[#666]">Ghi chú kỹ thuật số</span> <span class="px-3 py-1 bg-[#f4f4f5] border border-[#eaeaea] rounded-full text-xs font-medium text-[#666]">Không cần giấy tờ</span> <span class="px-3 py-1 bg-[#f4f4f5] border border-[#eaeaea] rounded-full text-xs font-medium text-[#666]">Noterich</span> </div>