Làm việc với Nhận dạng giọng nói: Lệnh, Đọc chính tả văn bản & Duyệt web

Phần mềm nhận dạng giọng nói(speech recognition software) trong Windows 7 phức tạp một cách đáng ngạc nhiên. Microsoft đã tích hợp vào nó rất nhiều tính năng mà trước đây chỉ có trong phần mềm nhận dạng giọng nói(speech recognition software) của bên thứ ba đắt tiền . Nhận dạng giọng nói(Speech Recognition) rất dễ sử dụng, nhưng cũng như tất cả các phần mềm phức tạp khác, bạn sẽ cần học một vài điều cơ bản trước khi có thể nói chuyện với máy tính trôi chảy như khi nói chuyện với bạn bè. Những điều cơ bản bao gồm: cách khởi động Nhận dạng giọng nói(Speech Recognition) , các lệnh thông thường, nhập văn bản, sửa và duyệt web.

Trong bài viết trước (Làm việc với Nhận dạng giọng nói(Speech Recognition) : Thiết lập và cấu hình(Setup and Configuration) ), tôi đã thảo luận về việc thiết lập thiết bị của bạn để thành công với Nhận dạng giọng nói(Speech Recognition) . Tôi sẽ bắt đầu ở đây bằng cách giả sử bạn đã thực hiện qua các bước, bao gồm cả hướng dẫn tích hợp của Microsoft(Microsoft) và bây giờ bạn đã sẵn sàng.

LƯU Ý:(NOTE:) Tôi sẽ không nói về mọi thứ bạn có thể làm với Nhận dạng giọng nói(Speech Recognition) — vì vậy tôi sẽ phải viết một cuốn sách! Nhưng tôi sẽ thảo luận về các cách sử dụng, cách viết và duyệt phổ biến nhất.

Bắt đầu nhận dạng giọng nói

Trước khi chúng tôi bắt đầu, hãy đóng tất cả các ứng dụng khác mà bạn đã mở trên màn hình của mình. (Điều này chỉ nhằm mục đích học tập — bạn có thể mở bao nhiêu ứng dụng tùy thích, sau khi bắt kịp tốc độ hoạt động của Nhận dạng giọng nói(Speech Recognition) và bạn có thể nói với máy tính của mình để hướng dẫn máy tính chuyển sang các ứng dụng khác. )

Bạn có thể chỉ cần nhập giọng nói(speech) vào hộp tìm kiếm của Start Menu , chọn Nhận dạng giọng nói(Speech Recognition) và bắt đầu nói — nhưng có một lý do rất tốt để thực hiện một chặng đường(way round) dài trong trường hợp này. Đi tới Control Panel -> Ease of Access -> Speech Recognition và nhấp vào Speech Recognition .

Speech Recognition

Như bạn có thể thấy, bạn đã quan tâm đến hầu hết những điều này. Bỏ(Skip) qua phần Huấn luyện máy tính của bạn để hiểu rõ hơn về bạn(Train your computer to better understand you) (tôi sẽ giải quyết vấn đề này trong bài viết tiếp theo, nơi tôi sẽ thảo luận về cách khắc phục sự cố) và nhấp vào Mở thẻ tham chiếu giọng nói(Open the Speech Reference Card) .

Speech Recognition

Điều này cung cấp cho bạn một chỉ mục về các chủ đề trợ giúp để khám phá. Bây giờ, hãy nhấp vào Các lệnh nhận dạng giọng nói phổ biến(Common speech recognition commands) .

Speech Recognition

Bạn sẽ thấy một biểu đồ đẹp về các lệnh được sử dụng phổ biến nhất và những gì bạn cần nói để kích hoạt chúng. Tôi khuyên bạn nên in cái này ra để tiện trong khi bạn đang tìm hiểu cách hoạt động của Nhận dạng giọng nói(Speech Recognition) .

Speech Recognition

Bạn cũng có thể tìm thấy danh sách tại đây: Các lệnh phổ biến trong Nhận dạng giọng nói(Common commands in Speech Recognition) .

Bây giờ bạn đã sẵn sàng! Nhấp vào Bắt đầu nhận dạng giọng nói(Start speech recognition) . Bạn sẽ thấy tiện ích Nhận dạng giọng nói(Speech Recognition) ở đầu màn hình và nó sẽ kêu vang để cho bạn biết rằng nó đang hoạt động. Tuy nhiên, theo mặc định, nó không "lắng nghe" bạn cho đến khi bạn yêu cầu nó.

Speech Recognition

Lời nhắc:(A reminder:) Bạn sẽ có màn hình trống với tiện ích Nhận dạng giọng nói ở trên cùng.(Speech Recognition)

Bây giờ, hãy đảm bảo rằng micrô của bạn đã được cắm vào, đảm bảo có ít tiếng ồn xung quanh(background noise) nhất có thể và nói "Bắt đầu nghe". ("Start listening.")Bạn sẽ thấy rằng tiện ích nhắc nhở bạn về điều này một cách hữu ích.

Speech Recognition

Đây là cụm từ duy nhất mà Nhận dạng giọng nói(Speech Recognition) sẽ "nghe thấy" khi nó ở chế độ không tải. Không có gì khác sẽ đánh thức nó. Bạn có thể thử nghiệm điều này, nếu muốn, trước khi nói với Nhận dạng giọng nói(Speech Recognition) những gì nó muốn nghe. Sau đó nói "Bắt đầu nghe"("Start listening") và bạn sẽ sẵn sàng nghe thử.

Speech Recognition

Đọc chính tả văn bản(Text) với nhận dạng giọng nói(Speech Recognition)

Bây giờ chương trình Nhận dạng giọng nói(Speech Recognition) đang hoạt động, bạn có thể làm gì với chương trình này? Có một số điều cần ghi nhớ. Nếu bạn không có ứng dụng nào đang hoạt động, bạn không thể làm gì nhiều vào thời điểm này. Nói "Bắt đầu"("Start") để mở Menu Bắt đầu(Start Menu) của bạn . Vì Nhận dạng giọng nói(Speech Recognition) là một sản phẩm của Microsoft(Microsoft product) nên nó hoạt động thành công nhất với các sản phẩm khác của Microsoft(Microsoft product) . Vì vậy, hãy(So let) chọn Notepad để thử nghiệm.

Cách bạn khởi động Notepad tùy thuộc vào cách cấu hình Start Menu của bạn . Nếu Notepad là một mục hiển thị khi bạn mở Start Menu , chỉ cần nói "Notepad". Nếu nó không có ở đó, hãy nói "Tất cả chương trình"("All programs,") , sau đó nói "Phụ kiện"("Accessories,") , sau đó nói "Notepad". Notepad("Notepad." Notepad) đã mở và sẵn sàng hoạt động.

Giờ thì sao? Chỉ cần bắt đầu nói chuyện. Ở đây, tôi thử một cụm từ quen thuộc. Tôi nói nó bằng một giọng trò chuyện bình thường và ở tốc độ bình thường.

Speech Recognition

Chờ(Wait) đã, không đúng đâu. Không có dấu chấm câu hoặc viết hoa(punctuation or capitalization) và hai từ bị sai. Làm thế nào tôi có thể sửa chữa nó?

Sử dụng lệnh select để chọn từng từ có vấn đề. Ở đây, tôi đã nói "Chọn bạn bè".("Select friends." )

Speech Recognition

Có gì sai với từ đó? Không có dấu phẩy sau nó, vì nó phải có. Vì vậy, sau khi "Bạn bè"("Friends") được chọn, tôi nói "Dấu phẩy bạn bè". ("Friends comma.")Cửa sổ bật lên với danh sách các lựa chọn khả thi

Speech Recognition

Tôi nói "Một"("One") để chọn mục đầu tiên, sau đó tôi nói "OK" để phê duyệt.

Speech Recognition

Làm việc theo cách của tôi qua câu, sau đó tôi chọn "La Mã"("romans") và nói "Dấu phẩy của người La Mã". ("Romans comma.")Hộp bật lên một lần nữa và một lần nữa tôi chọn mục mà tôi muốn.

Speech Recognition

Tôi sửa lỗi chính tả của "đồng hương"("countrymen")"tai"("ears") bằng cách chọn chúng, nói từ rõ ràng hơn và chọn cách viết đúng. Khi tôi hoàn thành với "đôi tai"("ears") , tôi nói "dấu chấm than".("exclamation point.")

Speech Recognition

Bây giờ tôi tiếp tục với một câu khác, đảm bảo rằng tôi cũng nói đúng dấu câu. Tính năng Nhận dạng giọng nói(Speech Recognition) hiểu tôi hơn nhiều lần này. Tất cả những gì tôi cần làm là chọn "caesar", viết hoa nó là xong.

Speech Recognition

Bây giờ, tôi muốn kết thúc dòng đó và chuyển sang dòng khác. Có hai cách để làm điều này. Nếu tôi nói "Dòng mới",("New line,") con trỏ sẽ thả xuống khoảng trống tiếp theo bên dưới nội dung trên màn hình.

Speech Recognition

Nếu tôi nói "Đoạn văn mới"("New paragraph") , con trỏ sẽ thả xuống hai dòng, vì vậy sẽ có khoảng cách giữa các đoạn văn.

Speech Recognition

Thực hành nói các(Practice speaking) câu và đoạn văn để bạn có thể thấy nó hoạt động như thế nào. Bạn có thể sẽ phải nói chậm hơn so với khi nói chuyện và có thể bạn sẽ phải sửa mọi thứ khi tiếp tục, nhưng Nhận dạng giọng nói(Speech Recognition) học nhanh chóng và sau khi bạn thực hành trong vài phút, độ chính xác của nhận dạng(recognition accuracy) sẽ là được cải thiện đáng kể.

Giả sử bây giờ tôi muốn lưu tài liệu này. Tôi sẽ làm thế nào nếu tôi đang sử dụng các menu (thay vì một phím tắt)? Tôi sẽ nhấp vào Tệp(File)Lưu dưới dạng(Save As) . Và đó là những gì tôi làm bây giờ. Tôi nói "Tệp"("File")"Lưu dưới dạng"("Save As") và nói tên tệp vào menu Lưu dưới dạng(Save As) .

Speech Recognition

Nhưng điều gì sẽ xảy ra nếu tôi không thích những gì tôi có trong tài liệu Notepad của mình và chỉ muốn xóa mọi thứ ra ngoài? "Chọn tất cả"("Select all") đánh dấu tất cả văn bản và "Xóa"("Delete") sẽ loại bỏ nó.

Speech Recognition

Khi bạn thực hành xong, hãy nói "Đóng Notepad". ("Close Notepad.")Bạn sẽ được hỏi có muốn lưu những gì mình đã viết hay không và bạn có thể nói "Lưu"("Save") hoặc "Không lưu"("Don't save") tùy thích.

Sử dụng nhận dạng giọng nói(Speech Recognition) với Internet Explorer

Như tôi đã đề cập, Nhận dạng giọng nói(Speech Recognition) hoạt động tốt nhất với các phần mềm khác của Microsoft(Microsoft software) . Hướng dẫn tích hợp của Microsoft(Microsoft) đã chỉ cho bạn NotepadWordPad và tìm hiểu sơ lược về Internet Explorer . Hãy cùng(Let) tìm hiểu thêm về tính năng Nhận dạng giọng nói(Speech Recognition) với Internet Explorer.

Nói "Bắt đầu"("Start") để mở menu bắt đầu. Ngay cả khi Internet Explorer không được hiển thị, hãy nói "Internet Explorer" và nó sẽ mở ra. Sau đó nói "Địa chỉ". ("Address.")Thao tác này sẽ đưa bạn đến thanh URL(URL bar) ở đầu màn hình. Nó có thể hiển thị một số trong thanh màu xanh lam.

Speech Recognition

Nói số đó và sau đó nói "OK". Như bạn có thể thấy, tiện ích sẽ nhắc bạn những gì nó mong đợi bạn làm ở đây.

Speech Recognition

Nói "www chấm bảy hướng dẫn dot com." ("w w w dot seven tutorials dot com.")Ồ ồ. Nhận dạng giọng nói(Speech Recognition) không hiển thị chính xác.

Speech Recognition

Nói "xóa cái đó". ("delete that.")Sau đó nói "Đánh vần"("Spell it") và nói từng ký tự riêng lẻ. Bạn sẽ cần phải nói "dấu chấm "("period") thay vì "dấu chấm". ("dot.")Bạn sẽ cần phải nói "Số bảy"("Number seven") để nhận được chữ số 7, sau đó viết chính tả phần còn lại của địa chỉ web(web address) .

Speech Recognition

Sau đó nói "OK". Địa chỉ được chuyển đến thanh URL(URL bar) . (Bạn có thể được yêu cầu thêm từ vào từ điển. Điều này là tùy thuộc vào bạn.) Khi địa chỉ nằm trong thanh URL(URL bar) , hãy nói "Nhấn enter". ("Press enter.")Và ở đó bạn đi.

Speech Recognition

LƯU Ý:(NOTE:) Khi bạn đọc một địa chỉ web vào thanh URL(URL bar) , bạn có thể nói "dấu chấm"("dot") thay vì "dấu chấm" . ("period.")Và bạn cần phải nói địa chỉ cùng một lúc. Đừng tạm dừng. Việc tạm dừng khiến Nhận dạng giọng nói(Speech Recognition) nghĩ rằng bạn muốn bắt đầu một câu mới.

Điều gì sẽ xảy ra nếu bạn muốn đọc một bài báo về 7 Hướng dẫn(7 Tutorials) ? Bạn sẽ chọn nó như thế nào? Nói "hiển thị số". ("show numbers.")Mỗi phần tử trên trang được phủ một số trong hộp màu xanh lam. Nói số của bài báo bạn muốn đọc (ở đây, là số 34(number 34) ). Sau đó nói "OK".

Speech Recognition

Nói "OK" và bài báo sẽ mở ra. (Bạn cũng nên tận dụng ưu đãi tuyệt vời này.)

Speech Recognition

Và còn nữa

Như bạn có thể thấy, Nhận dạng giọng nói(Speech Recognition) dễ sử dụng một cách đáng ngạc nhiên, ngay từ đầu. Làm quen với nó chỉ là một vấn đề của thực hành. Hãy thử chọn các chương trình yêu thích của bạn từ Start Menu và xem bạn có thể làm gì với chúng. Không phải tất cả chúng sẽ hoạt động. (Có vẻ như các chương trình của Adobe không thực sự tương thích.) Cách duy nhất để tìm ra những gì tương thích và những gì không là thử. Nếu có những chương trình bạn sử dụng mọi lúc không tương thích với tính năng Nhận dạng giọng nói(Speech Recognition) tích hợp sẵn này và bạn thấy mình thích nói chuyện với máy tính hơn, bạn sẽ muốn khám phá các tùy chọn phức tạp hơn từ các công ty khác. chẳng hạn như Dragon naturalSpeaks Premium 11.5(Dragon NaturallySpeaking Premium 11.5) .

In the next article, I will talk about troubleshooting Speech Recognition and solving some of the most common problems. In the meantime, keep practicing and experimenting. I think you will be pleasantly surprised at how well it works.



About the author

Tôi là một kỹ sư phần mềm và blogger với gần 10 năm kinh nghiệm trong lĩnh vực này. Tôi chuyên tạo các bài đánh giá và hướng dẫn về công cụ cho các nền tảng Mac và Windows, cũng như cung cấp các bình luận của chuyên gia về các chủ đề phát triển phần mềm. Tôi cũng là một diễn giả và người hướng dẫn chuyên nghiệp, từng thuyết trình tại các hội nghị công nghệ trên thế giới.



Related posts