Hai công cụ phiên âm để chuyển âm thanh thành văn bản

Khi thời đại kỹ thuật số phát triển, việc sáng tạo nội dung tiếp tục đóng vai trò cực kỳ quan trọng. Đặc biệt, việc sản xuất video tiếp tục có tầm quan trọng phát triển - đối với cả những cá nhân đang cố gắng vươn lên trở thành người có ảnh hưởng trong một thế giới xoay quanh truyền thông xã hội và 63% doanh nghiệp hiện đang tận dụng video và, trong số đó, 82% nhận thấy nó là một phần quan trọng trong chiến lược của họ. Trong khi đó, podcasting đang bùng nổ và dự kiến ​​sẽ tiếp tục.

Nhưng chỉ tạo ra nội dung âm thanh và / hoặc hình ảnh này là không đủ. Công việc của tiếp thị nội dung mở rộng đến việc giúp mọi người tìm thấy những gì bạn tạo ra.

Ngoài việc tận dụng phương tiện truyền thông xã hội, đây là nơi SEO (tối ưu hóa công cụ tìm kiếm) đóng một vai trò quan trọng, tức là phân phát từ khóa và sử dụng các phương pháp hay nhất khác để giúp các công cụ tìm kiếm như Google khám phá nội dung của bạn.

Tại sao phiên âm lại quan trọng

Một công cụ phiên âm tốt có thể tạo ra sự khác biệt lớn trong việc thúc đẩy SEO và khối lượng nội dung tổng thể của bạn. Bằng cách tận dụng một nền tảng tự động hóa quy trình phiên âm hoặc cung cấp một nền tảng nâng cao mà bạn có thể phiên âm âm thanh theo cách thủ công, bạn có thể ngay lập tức tăng sự hiện diện trên web của mình với nhiều nội dung phong phú hơn - trong trường hợp này là nội dung liên quan trực tiếp đến nội dung âm thanh hoặc video mà bạn muốn mọi người khám phá - với ít nỗ lực.

Tất nhiên, có thể có những lý do khác khiến bạn sử dụng công cụ phiên âm, chẳng hạn như phiên âm các cuộc hội thoại đã ghi lại mà bạn đã có với mục đích viết bài với các trích dẫn và cốt truyện chính xác.

Hoặc, có lẽ bạn đã ghi lại các cuộc trò chuyện với những người thân yêu đã qua đời và muốn lưu giữ những khoảnh khắc đó ở định dạng mà bạn và những người khác có thể quay lại và đọc.

Bất kể(Regardless) lý do của bạn để sản xuất nội dung dựa trên âm thanh, việc chép lại nội dung đó có thể là một bước đi thông minh. Nếu điều đó nghe có vẻ đáng giá đối với bạn, thì có rất nhiều công cụ phiên âm có sẵn, từ miễn phí đến dựa trên đăng ký để bạn lựa chọn.

Dưới đây là ba lợi ích độc đáo và do đó, rất đáng để điều tra ngay lập tức

Phiên âm Amazon

Loại: (Type:)Phiên âm tự động
( Automatic Transcription)Người dùng: (User: )Doanh nghiệp; Các nhà phát triển; Chi phí nhà tiếp thị
(Businesses; Developers; Marketers): (Cost:)Thanh toán khi bạn di chuyển( Pay-as-you-go)

Trong khi Amazon tiếp tục mở rộng sự hiện diện của mình trên khắp các ngành, công ty con Amazon Web Services ( AWS ) của họ tiếp tục mở rộng bề rộng và chiều sâu của các nền tảng điện toán đám mây theo yêu cầu, cung cấp khoảng 120 giải pháp tiên tiến và độc đáo khác nhau, từ các công cụ dành cho nhà phát triển đến phân tích đến phiên mã tự động và hơn. Đây là điều khiến Amazon Transcribe trở nên đáng giá như vậy.

ASR dành cho nhà phát triển ứng dụng

Khi mới nghĩ, bạn có thể thắc mắc tại sao một công ty cung cấp công cụ cho các nhà phát triển lại cung cấp dịch vụ nhận dạng giọng nói tự động ( ASR ) như Amazon Transcribe . Sẽ rất có ý nghĩa khi bạn xem xét tầm quan trọng của việc xây dựng các ứng dụng thông minh trong thời đại kỹ thuật số của chúng ta.

AWS Transcribe cho phép các nhà phát triển xây dựng khả năng chuyển lời nói thành văn bản vào ứng dụng của họ. Amazon cho biết, nơi điều này có thể hữu ích cho một doanh nghiệp là sao chép các cuộc gọi với khách hàng hoặc tạo phụ đề cho âm thanh và video .

Một lần nữa, điều này cũng sẽ hữu ích cho các nhà tiếp thị đang cố gắng tăng khối lượng nội dung phong phú và cần một cách để lấy nội dung âm thanh hiện có và chuyển nó thành văn bản, sau đó có thể được sử dụng để tạo các bài đăng blog, bài báo, v.v.

Tự động hóa mọi thứ

Đó là một việc để tự động hóa một quy trình chung nhưng vẫn để lại các bit và mảnh cho người dùng quản lý sau khi thực tế. Mục tiêu của AWS đối với Amazon Transcribe là để lại ít công việc nhất có thể cho người dùng với một loạt các tính năng nâng cao, bao gồm nhưng không giới hạn ở:

  • Bản ghi đã chỉnh sửa:(Edited Transcriptions: ) Thay vì cung cấp cho bạn một kết xuất văn bản, Amazon Transcribe sử dụng công nghệ máy học để hiểu vị trí cần thiết của dấu câu và định dạng đầu ra văn bản sao cho dễ dàng sẵn sàng và không cần chỉnh sửa ít hoặc không cần chỉnh sửa.
  • Dấu thời gian:(Timestamps: ) Công cụ phiên âm bao gồm dấu thời gian cho mỗi từ, giúp bạn có thể xác định âm thanh trong bản ghi gốc của mình chỉ bằng cách tìm kiếm văn bản.
  • Từ vựng tùy chỉnh:(Custom Vocabulary: ) Bạn có khả năng mở rộng và tùy chỉnh các từ vựng mà AWS Transcribe nhận dạng để đảm bảo các từ cụ thể không bị hiểu sai. Điều này giúp công cụ phiên âm cực kỳ chính xác.
  • Nhận dạng nhiều người nói:(Multiple-Speaker Recognition: ) Nếu âm thanh của bạn bao gồm nhiều người nói, Amazon Transcribe có thể nhận ra khi một người mới đang nói và áp dụng cách hiểu này cho bản ghi âm của họ, giúp bạn tiết kiệm thời gian trong việc xác định đúng người nói khi bạn chỉnh sửa.
  • Phiên âm thời gian thực:(Real-Time Transcription: ) Bạn không cần phải chờ đợi để có bản ghi âm để phiên âm bằng công cụ phiên âm này. Nếu bạn đang phát trực tiếp âm thanh, bạn có thể gửi âm thanh đó bằng kết nối an toàn qua giao thức HTTP 2 tới Amazon Transcribe và lấy lại luồng âm thanh đã chép theo thời gian thực.

Đó là một công cụ phiên âm nâng cao có thể yêu cầu kiến ​​thức kỹ thuật sâu để tận dụng mọi tính năng và chức năng có sẵn, nhưng Amazon Transcribe đồng thời đủ đơn giản để bất kỳ ai cũng có thể tận dụng để tăng năng suất. Đây là một video chi tiết hơn:

Có các công cụ phiên âm khác có thể so sánh được với Amazon Transcribe ( Google Speech , Temi , IBM Watson , v.v.), nhưng thực tế là AWS đã cung cấp một loạt các dịch vụ và công cụ mà hầu hết các doanh nghiệp đã và đang tận dụng để trả tiền. - cơ sở tùy thích và bạn có quyền truy cập vào tất cả chúng bằng một tài khoản AWS - bao gồm cả Amazon Transcribe .

Do đó, nó có khả năng trở thành công cụ nổi bật cho các doanh nghiệp, nhà phát triển và nhà tiếp thị.

Sự thật: Người dùng nói gì

“Amazon Transcribe thật tuyệt vời và nhanh chóng nhưng nó không hoàn hảo, bạn hoặc ai đó nên quay lại và kiểm tra kỹ văn bản cho âm thanh. Thật khó chịu, vâng, nhưng cách ít hơn là phải gõ tất cả bằng tay… nếu bạn cũng là một lập trình viên thông minh, đây có thể là một quy trình thực sự gọn gàng và tiết kiệm thời gian để xem xét. Nhưng nếu bạn chỉ là một người làm video đơn giản như tôi, thì quá trình này vẫn có thể hiệu quả với bạn ”.(“Amazon Transcribe is fantastic and fast but its not perfect, you or someone else should go back and double check the text to the audio. Annoying, yes, but way less so than having to type it all up manually … if you are also a clever coder this could be a really neat and time saving process to look in to. But if you are just a simple video dude like myself, this process can still work for you.”)

oTranscribe

Loại: (Type:)Phiên âm thủ công
( Manual Transcription)Người dùng: (User: )Nhà báo; Người tiếp thị; Chi 
(Journalists; Marketers; Nonprofessionals )phí phi chuyên nghiệp: (Cost:)Miễn phí( Free)

Chỉ vì bạn có thể tự động hóa một cái gì đó không có nghĩa là bạn luôn nên làm như vậy. Đôi khi, đây là trường hợp với phiên âm.

Mặc dù có các công cụ phiên âm tự động nâng cao như Amazon Transcribe giúp bạn tiết kiệm thời gian và năng lượng, nhưng đôi khi sẽ thông minh hơn khi sử dụng công cụ phiên âm thủ công, mã nguồn mở, dựa trên trình duyệt như oTranscribe .

Nhận cá nhân

Các lợi ích của công cụ phiên âm thủ công là rất nhiều, từ việc cải thiện độ chính xác của nhận dạng từ đến việc phân biệt người nói và chồng chéo âm thanh tốt hơn. Không chỉ vậy, việc chép lại âm thanh theo cách thủ công cho phép một người quen thuộc hơn với nội dung.

Điều này có thể hữu ích nếu, ví dụ, bạn là một nhà báo đang ghi lại một cuộc phỏng vấn được ghi lại và cần hiểu mức độ sâu sắc mà bạn đang viết về nó và cái nhìn sâu sắc về chủ đề của bạn, hoặc thiếu nó, sẽ đóng góp như thế nào vào câu chuyện.

Kiểm soát tốc độ phát lại

Tất nhiên, thách thức lớn nhất đối với phiên âm thủ công là bắt kịp với đoạn âm thanh khi bạn gõ nó ra trong khi vẫn duy trì độ chính xác đối với các từ và câu cũng như cấu trúc thực tế của cuộc hội thoại.

Ví dụ, hiểu khi nào đối thoại thuộc cùng một đoạn hoặc khi chủ đề của cuộc trò chuyện chuyển sang và yêu cầu một phần mới. Tất cả những điều này đóng góp vào hiệu quả mà bạn có thể đọc và chỉnh sửa bản ghi sau này.

Một tính năng quan trọng của oTranscribe là bộ điều chỉnh tốc độ âm thanh của nó, bằng cách nhấp và kéo hoặc sử dụng các phím chức năng được chỉ định của công cụ phiên âm, bạn có thể di chuyển công tắc của bộ điều chỉnh sang trái để giảm tốc độ hoặc sang phải để tăng tốc độ âm thanh.

Tính linh hoạt này giúp bạn dễ dàng theo kịp âm thanh khi phiên âm, nhưng nó cũng giúp bạn có thể đạt được độ rõ ràng hơn trong trường hợp các từ hoặc cụm từ có thể phát ra tốt hơn ở tốc độ chậm hơn hoặc nhanh hơn.

Phiên âm + Chỉnh sửa + Lưu trữ

Một lợi ích tuyệt vời của oTranscription là bạn có thể làm mọi thứ trong ứng dụng, không bao giờ phải rời đi cho đến khi bạn sẵn sàng xuất kết quả của mình. Sau khi tải lên âm thanh của mình và đặt tốc độ phát lại, bạn có thể bắt đầu tận dụng các chức năng soạn thảo văn bản tiêu chuẩn khác để nâng cao chất lượng bản chép lời của mình ngay lập tức.

Từ in đậm và in nghiêng văn bản đến bao gồm dấu thời gian để xem bản ghi của bạn hiện có bao nhiêu từ, oTranscribe cung cấp cho bạn những điều cơ bản bạn cần trong một công cụ phiên âm.

Khi bạn đang ghi chép, oTranscribe tự động lưu công việc của bạn vào bộ nhớ của trình duyệt mỗi giây. Nó cũng cung cấp lịch sử bản ghi, nơi bạn có thể xem các phiên bản trước đó được lưu sau mỗi năm phút, với công cụ phiên âm luôn lưu tới 100 phiên bản trong số này.

Khi bạn đã sẵn sàng xuất, bạn có thể tải xuống tệp dưới dạng tệp đánh dấu, văn bản hoặc tệp oTranscribe hoặc bạn có thể tải tệp đó lên dưới dạng tệp lên Google Drive , giúp quá trình chuyển đổi từ công cụ phiên âm sang nền tảng khác diễn ra khá liền mạch.

Sự thật: Người dùng nói gì

“Tôi sử dụng oTranscribe. Tôi loại bỏ 'ums' và sửa bất kỳ lỗi cú pháp nào không có ý nghĩa khi được đọc. "(“I use oTranscribe. I leave out ‘ums’ and fix any syntax errors that won’t make sense when being read.”)

“+1 for oTranscribe, that service is gold.”

Chọn một công cụ

Khi phiên âm một tập podcast, bạn nên sử dụng công cụ phiên âm tự động hóa quy trình. Nhưng khi viết một bài báo, nơi bạn đang chắp nối một câu chuyện và tìm kiếm những trích dẫn nổi bật, bạn có thể được lợi nhiều hơn từ việc chép lại âm thanh theo cách thủ công.

Đối với việc bạn sử dụng công cụ nào để hoàn thành những công việc đó, sở thích cá nhân, năng khiếu kỹ thuật và chi phí có lẽ là những yếu tố lớn nhất.



About the author

Tôi là một kỹ sư phần mềm và blogger với gần 10 năm kinh nghiệm trong lĩnh vực này. Tôi chuyên tạo các bài đánh giá và hướng dẫn về công cụ cho các nền tảng Mac và Windows, cũng như cung cấp các bình luận của chuyên gia về các chủ đề phát triển phần mềm. Tôi cũng là một diễn giả và người hướng dẫn chuyên nghiệp, từng thuyết trình tại các hội nghị công nghệ trên thế giới.



Related posts