Bạn có nhớ những câu chuyện kinh dị từ những ngày Windows XP nhận dạng giọng nói không? Tuy nhiên, đó là một mớ hỗn độn, với sự gia tăng của AI và học máy, chuyển giọng nói thành văn bản (không văn bản thành bài phát biểu) phiên mã đã trở nên đáng tin cậy và hiệu quả hơn bao giờ hết. Có nhiều bài phát biểu cho các ứng dụng văn bản làm được điều đó trong thời gian thực nhưng nếu bạn muốn chuyển ghi âm giọng nói sang văn bản thì sao? Tôi đã lập danh sách các giải pháp tốt nhất để chuyển đổi bản ghi âm giọng nói thành văn bản trên thiết bị di động, trình duyệt web và PC của bạn. Hãy kiểm tra chúng.
Để kiểm tra độ chính xác của phần mềm sau đây, chúng tôi sẽ sử dụng tính năng ghi lại một phút đầu tiên của video YouTube này.
Chuyển bản ghi âm giọng nói của bạn thành văn bản
1. Phiên âm
Phiên âm ghi âm cả video và âm thanh thành văn bản. Mặc dù ứng dụng miễn phí nhưng ứng dụng kiếm tiền từ thời gian phiên âm hàng giờ. So với các tùy chọn cao cấp hơn trong danh sách này như Happyscribe, mức giá khá hợp lý chỉ $ 4,99. Nhà phát triển không chỉ rõ liệu họ đang sử dụng API chuyển lời nói thành văn bản như Google Cloud Input hay một giải pháp tùy chỉnh.
Đọc: Phần mềm TTS tốt nhất cho Mac
Ứng dụng đưa ra kết quả rõ ràng với dấu chấm câu bị thiếu ở đây và ở đó. Nó chỉ gặp rắc rối với những từ không rõ ràng hoặc bị bóp méo một chút. Dù bằng cách nào, ứng dụng vẫn xuất ra từ gần nhất và tự chấm điểm bản phiên âm. Tuy nhiên, kết quả đầu ra rất tuyệt vời, một bước tiến rõ ràng từ các giải pháp miễn phí như Bear Converter và với mức 4,99 đô la mỗi giờ sao chép, nó sẽ không phá vỡ ngân hàng.
Độ chính xác: 96%
Cài đặt phiên âm (iOS)
2. Rái cá.AI
Otter là một ứng dụng phiên âm tuyệt vời dành cho sinh viên và giúp họ giảm bớt công việc ghi chép tẻ nhạt. Không chỉ Sinh viên, nó phổ biến không kém ở các chuyên gia, những người sử dụng nó để ghi biên bản các cuộc họp và hội nghị. Mặc dù nó được thiết kế để ghi âm khi đang di chuyển, bạn vẫn có thể tải lên bản ghi âm giọng nói từ bộ nhớ cục bộ và phiên âm tệp âm thanh. Tất cả quá trình phiên âm diễn ra trên đám mây và bạn nhận được hai biến thể của tập lệnh. Bản nháp đầu tiên là bản ghi nhanh được tạo trong vòng vài giây và có thể có lỗi, tuy nhiên, âm thanh được xử lý lại trên đám mây và cải thiện đáng kể độ chính xác của bản ghi. Ứng dụng này miễn phí và có sẵn cho cả Android và iOS, bạn có thể phiên âm lên đến 600 phút.
Có liên quan: Ứng dụng OCR tốt nhất cho iPhone
Trong quá trình thử nghiệm của tôi, tôi thấy ứng dụng vẫn rất chính xác và có tất cả các từ đúng, nó vẫn gặp khó khăn với các dấu chấm câu. Nó cũng không thể xác định bất kỳ thay đổi đoạn văn nào nhưng đó không phải là vấn đề lớn vì tôi vẫn có thể chỉnh sửa tập lệnh sau đó.
Độ chính xác: 94%
Cài đặt Otter (Android | iOS)
3. Đăng ký
Happyscribe là tùy chọn trực tuyến đầu tiên trong danh sách này. Đó là một dịch vụ trả phí nhắm mục tiêu đến các chuyên gia, bao gồm cả các nhà báo — và giá cả chắc chắn cho thấy điều này: Khoản thanh toán của Happyscribe khi bạn thực hiện kế hoạch là 12 Euro mỗi giờ. Đối với loại tiền đó, cần phải có một phần thưởng có ý nghĩa. Điều này xuất hiện dưới dạng thuật toán máy học nâng cao của Happyscribe — thuật toán này sử dụng để xác định và phiên âm giọng nói. Thuật toán của Happyscribe đủ nâng cao để nhận ra nhiều khác nhau loa — nó làm cho quá trình vượt qua thứ hai nhanh hơn bằng cách cung cấp chế độ bản đồ nhiệt cho bạn biết chính xác vị trí trong bản ghi mà thuật toán của nó gặp khó khăn. Bạn cũng có nhiều tùy chọn xuất tệp, từ tài liệu Word và tệp văn bản thuần túy đến SRT có dấu thời gian.
Đọc: Ứng dụng tốt nhất cho người cao tuổi sống một mình
Nó cho kết quả đáng kinh ngạc và gần như đúng tất cả các từ, thậm chí nó còn phát hiện ra những thay đổi của đoạn văn, điều này thật tuyệt nếu bạn có nhiều người nói trong một cuộc trò chuyện. Happyscribe có bản dùng thử miễn phí cho phép bạn truy cập vào 30 phút phiên âm. Nói chung, nếu bạn đang tìm kiếm giải pháp chuyển âm thanh thành văn bản trực tuyến tốt nhất trong lớp, thì Happyscribe là một lựa chọn tuyệt vời.
Độ chính xác: 99%
Kiểm tra Happyscribe
4. Sonix
Sonix rất giống với Happyscribe và hướng đến cùng một loại thị trường mục tiêu — người dùng doanh nghiệp muốn có một giải pháp phiên âm dựa trên AI đáng tin cậy, thực sự hoàn thành công việc, mặc dù chỉ bằng một phần nhỏ chi phí phiên mã của con người. Định giá của Sonix phản ánh điều này: Bạn đang xem xét đăng ký 11,25 đô la mỗi tháng cho giấy phép một người dùng với mức giá cao nhất là 6 đô la mỗi giờ cho các bản ghi. Nếu bạn đang tìm cách xử lý khối lượng lớn, điều này làm cho nó cạnh tranh hơn so với Happyscribe nhưng cách sau sẽ thắng đối với các trường hợp sử dụng khối lượng nhỏ hơn. Sonix cũng có 30 phút dùng thử miễn phí, mặc dù bạn sẽ phải nhập thông tin thẻ tín dụng / thẻ ghi nợ của mình để truy cập. Chúng tôi đã dùng thử và vô cùng ngạc nhiên bởi chất lượng của bản chép lời.
Đọc: Đây là phần mềm Phiên âm tốt nhất cho Mac
Cũng giống như với Hyperscribe, Sonix đã cho thấy kết quả cực kỳ tốt. Không một từ nào được phiên âm sai. Một điểm khác cần lưu ý là Sonix mất ít thời gian hơn đáng kể để hoàn tất quá trình ghi chép so với Happyscribe.
Độ chính xác: 97%
Kiểm tra Sonix
5. Bear File Converter
Phần mềm phiên âm chuyên nghiệp có thể đắt tiền! Ngay cả khi bạn đang bỏ lỡ phiên âm tốt nhất trong ngành, thì các lựa chọn thay thế miễn phí vẫn phù hợp hơn nếu ngân sách của bạn bằng không. Chúng tôi đã thử dùng công cụ chuyển đổi Bear như một tùy chọn miễn phí. Đây là một công cụ chuyển đổi đa phương tiện cho phép bạn chuyển đổi bất kỳ loại tệp nào thành bất kỳ loại tệp nào khác và nó tình cờ có một MP3 sang TXT trình chuyển đổi sử dụng công cụ nhận dạng giọng nói của Baidu.
Mặc dù nhận dạng Baidu không hoàn hảo nhưng nó đã phiên âm chính xác khoảng 70% bài phát biểu. Không tồi đối với một trình chuyển đổi phương tiện thậm chí không được quảng cáo là phần mềm phiên âm! Các tệp âm thanh dành cho phiên âm có giới hạn 3MB. Bạn có thể giảm kích thước tệp bằng cách mã hóa lại thành tốc độ bit thấp hơn nhưng điều đó chỉ có thể làm cho khả năng nhận dạng tồi tệ hơn.
Độ chính xác: 70%
Kiểm tra Bear File Converter
6. Sobolsoft MP3 to Text Converter
Sobolsoft có hơn 1500 ứng dụng và phiên âm âm thanh chỉ là một trong số đó. Trình chuyển đổi Sobolsoft Speech to Text yêu cầu thiết lập nhiều hơn một chút so với hầu hết. Bạn cần có khóa IBM Speech to Text API để làm cho nó hoạt động. Tính năng chuyển lời nói thành văn bản của Watson cung cấp cho bạn 100 phút phiên âm miễn phí mỗi tháng, sau đó nó được định giá theo tỷ lệ mỗi phút. Bản thân Sobolsoft có một phiên bản miễn phí và một phiên bản trả phí $ 19,99. Ngoài màn hình khó chịu, tôi không nhận thấy bất kỳ sự khác biệt đáng kể nào khi sử dụng phiên bản miễn phí.
Kết quả kiểm tra là rõ ràng khi bạn đưa IBM’s Watson trong hình. Tuy nhiên, kết quả không tốt hơn một số ứng dụng tiên tiến hơn ở trên như Happyscribe và Otter. Nó không nhận ra bất kỳ dấu câu hoặc thay đổi đoạn văn nào.
Độ chính xác: 93%
Kiểm tra Sobol Mp3 to Text Converter
Lời kết
Đây là những lựa chọn của tôi cho các ứng dụng tốt nhất để chuyển đổi bản ghi âm giọng nói thành văn bản. Otter và Transcribe là giải pháp tốt nhất cho người dùng di động. Sonix rẻ hơn Hyperscribe nếu bạn định phiên âm nhiều hơn. Sobolsoft MP3 to Text là loại lỗi thời nhưng nó vẫn còn mới và mạnh mẽ trong xương. Bạn thích ứng dụng nào nhất trong danh sách này hoặc nếu bạn có giải pháp tốt hơn, hãy cho tôi biết trong phần bình luận bên dưới?
Đọc: Ứng dụng điện thoại tốt nhất dành cho Android