Hệ thống SYNC hiểu lời nói của chúng ta như thế nào?

(LĐTĐ) Đâu là nguồn cảm hứng cho con người làm việc hàng ngày? Đối với ông Stephen Cooper, trưởng nhóm nghiên cứu và phát triển công nghệ nhận diện giọng nói SYNC® 3, nguồn cảm hứng cho những đóng góp của ông vào hệ thống này xuất phát từ cảm giác an tâm khi biết người thân và bạn bè của ông được tập trung lái xe an toàn và không bị sao nhãng.
Xe bán tải Ford Ranger có thể thay thế xe gia đình?
Tăng cường tiện nghi và an toàn nhờ công nghệ kết nối trên xe hơi
Ford Việt Nam tặng xe cứu thương áp lực âm cho Bệnh viện Nhiệt đới Trung ương

Đặt con người vào vị trí trung tâm của sự phát triển

Sau nhiều lần chứng kiến những hậu quả đến từ việc lái xe mất tập trung, ông Cooper nhận ra sự cấp thiết trong việc tối ưu hóa công nghệ kích hoạt bằng giọng nói của SYNC®, bằng cách giản lược thông tin đầu vào xuống chỉ còn một câu lệnh.

“Tôi đã gặp nhiều vụ tai nạn xảy ra do tài xế mất tập trung khi lái xe, và điều đó đã thôi thúc tôi nghiên cứu và phát triển công nghệ này. Nhờ giảm thiểu tối đa sự phân tâm cũng như dễ dàng vận hành, hệ thống kích hoạt bằng giọng nói sẽ đảm bảo tài xế tập trung điều khiển xe một cách an toàn”, ông Cooper chia sẻ.

he thong sync hieu loi noi cua chung ta nhu the nao 1
SYNC là trang bị tiêu chuẩn trên nhiều dòng xe khác nhau của Ford

Ông Cooper là nhân sự thuộc nhóm Phát triển Công nghệ nhận diện giọng nói của Ford tại trụ sở Dearborn, Michigan - đơn vị chịu trách nhiệm phát triển các tính năng cho hệ thống SYNC® 3. Việc xây dựng một hệ thống kích hoạt bằng giọng nói đơn giản và phù hợp cho khách hàng là một trong những mục tiêu chính của nhóm.

Công nghệ kích hoạt bằng giọng nói đã trở thành một phần của hệ thống SYNC® ngay từ những phiên bản đầu tiên cách đây 13 năm. Chính thức ra mắt vào năm 2014, SYNC® 3 đã và đang được cải tiến không ngừng. Hiện nay, với khả năng hỗ trợ lên tới 25 ngôn ngữ, hệ thống này đã đem đến cơ hội trải nghiệm cho nhiều người dùng trên toàn thế giới hơn.

Là trang bị tiêu chuẩn trên nhiều dòng xe khác nhau của Ford, SYNC® đã có bước phát triển vượt bậc - trở thành một trong những hệ thống kích hoạt bằng giọng nói trực quan và tiên tiến nhất hiện nay.

Thiết kế cốt lõi SYNC® là hệ thống nhận diện và ra lệnh bằng giọng nói - hoạt động giống như một bộ não nhận diện giọng nói. Cụm dữ liệu ngôn ngữ tích hợp với phần mềm giải mã sẽ chia nhỏ âm thanh để phân tích và hiểu từng câu mệnh lệnh của người dùng.

Ví dụ như câu lệnh “Gọi John Doe”, sẽ được ghi nhận bằng hơn 25 ngôn ngữ trên hệ thống SYNC®. Ngoài ra, một lượng lớn câu lệnh tương ứng với các tính năng (có thể kích hoạt bằng giọng nói trong) trên xe cũng được lưu trữ trong cụm dữ liệu ngôn ngữ của SYNC®.

Bên cạnh đó, phần mềm giải mã giọng nói sẽ lọc ra đặc tính âm thanh của từng câu lệnh để khớp với danh sách các từ trong cụm dữ liệu ngôn ngữ. Như ví dụ trên, khi người dùng nói “Gọi John Doe”, phần mềm giải mã sẽ phân tích đặc tính của đoạn âm thanh thu được, sau đó tìm kiếm trong cụm dữ liệu ngôn ngữ để tìm ra mệnh lệnh (được lưu sẵn) có đặc tính âm thanh tương tự, qua đó giúp hệ thống SYNC® hiểu được yêu cầu từ người sử dụng.

Giọng nói thuộc các vùng miền khác nhau trên cùng một quốc gia cũng được lưu ý. Ở những ngôn ngữ được hỗ trợ như tiếng Anh, tiếng Trung, tiếng Thái… có rất nhiều phương ngữ và giọng nói khác nhau giữa các vùng miền vì vậy dữ liệu ngôn ngữ cũng được cập nhật đa dạng để nâng cao khả năng nhận diện một câu lệnh của hệ thống.

Tương lai của công nghệ kích hoạt bằng giọng nói

Nhóm Phát triển Công nghệ nhận diện giọng nói của Ford được lãnh đạo bởi bà Yvonne Gloria, người đã có những đóng góp đáng kể trong quá trình cải tiến công nghệ này, kể từ khi SYNC® 3 ra mắt công chúng vào năm 2014.

he thong sync hieu loi noi cua chung ta nhu the nao
SYNC mang lại nhiều cơ hội cho các phương tiện khi được trang bị

Là một chuyên gia kỹ sư phần mềm, bà Gloria chia sẻ rằng sự đơn giản chính là chìa khóa dẫn đến thành công của hệ thống SYNC®. “Đa số người sử dụng phần mềm của chúng tôi đều không phải là kỹ sư. Chính vì vậy, chúng tôi đã phát triển phần mềm này để phục vụ những mục đích cụ thể và thực tế, nhưng không thể ép buộc khách hàng phải có một cái nhìn tương tự về sản phẩm. Điều này đã thúc đẩy tôi đặt mình vào suy nghĩ của một khách hàng, chứ không phải của một kỹ sư, từ đó, nghiên cứu cách những người dùng phổ thông tìm hiểu và ứng dụng công nghệ”, bà Gloria cho biết.

Sự tiến hoá không ngừng trên thế giới đã giúp các kỹ sư trong nhóm nỗ lực từng ngày để tinh chỉnh và mở rộng các tính năng của SYNC®. Bằng cách phân tích hành vi sử dụng SYNC® của khách hàng, các kỹ sư tiếp tục phát triển hệ thống trở nên trực quan và thân thiện hơn như tinh giản các tác vụ, hoặc đơn giản hóa việc truy cập. Qua quá trình đó, hơn 80% các câu lệnh của SYNC® đã có thể thực hiện chỉ với một bước.

Thông qua các nghiên cứu và phân tích chuyên sâu qua mạng không dây của SYNC® 3, các kỹ sư có thể ghi nhận một nguồn dữ liệu âm thanh đều đặn về cách khách hàng sử dụng SYNC® 3 cho các mục đích khác nhau. Từ đó, họ có thể phát hiện các lỗi phổ biến mà người dùng hay gặp phải, từ đó, sắp xếp và cải tiến các tác vụ phù hợp hơn, thay vì bỏ mặc người dùng tự xoay sở. Tất cả dữ liệu được thu thập đều phải có sự chấp thuận của người dùng.

“Chúng tôi liên tục theo dõi các phản hồi từ thị trường mục tiêu để nâng cấp tính năng và tạo ra các phiên bản cập nhật mới nhất. Công việc này sẽ liên tục được duy trì cho đến khi vòng đời sử dụng của sản phẩm kết thúc.” - ông Cooper chia sẻ thêm.

“Rất nhiều cơ hội được mở ra cho các phương tiện được trang bị SYNC®, nhằm nâng tầm trải nghiệm của tài xế.” - bà Gloria giải thích. Đặc biệt, công nghệ hiện nay đang phát triển nhanh chóng và các màn hình giải trí cỡ lớn trên xe sẽ dần thay thế những nút bấm truyền thống, tạo nên một sân chơi đầy tiềm năng cho công nghệ kích hoạt bằng giọng nói trong tương lai.

Đỗ Đạt

Nên xem

Giá xăng dầu hôm nay (23/11): Giá dầu thế giới tăng cao nhất trong hai tuần

Giá xăng dầu hôm nay (23/11): Giá dầu thế giới tăng cao nhất trong hai tuần

(LĐTĐ) Hôm nay (23/11/2024), giá dầu thế giới tăng khoảng 1%, đạt mức cao nhất trong hai tuần, do cuộc xung đột leo thang ở Ukraine làm tăng mức rủi ro địa chính trị. Cụ thể, giá dầu WTI ở mốc 71,25 USD/thùng, tăng 1,64%, giá dầu Brent ở mốc 75,14 USD/thùng, tăng 1,23%.
Giá vàng hôm nay 23/11: Giá vàng miếng SJC, vàng nhẫn đồng loạt tăng cao

Giá vàng hôm nay 23/11: Giá vàng miếng SJC, vàng nhẫn đồng loạt tăng cao

(LĐTĐ) Giá vàng hôm nay 23/11: Giá vàng thế giới nhảy vọt thúc đẩy giá vàng miếng SJC lẫn vàng nhẫn cùng lên mốc cao mới.
Dự báo thời tiết Hà Nội ngày 23/11: Trời nhiều mây, trưa chiều giảm mây trời nắng

Dự báo thời tiết Hà Nội ngày 23/11: Trời nhiều mây, trưa chiều giảm mây trời nắng

(LĐTĐ) Dự báo ngày 23/11, khu vực Hà Nội trời nhiều mây, không mưa, trưa chiều giảm mây trời nắng.
Mối đe dọa từ những vật lạ rơi xuống từ nhà cao tầng

Mối đe dọa từ những vật lạ rơi xuống từ nhà cao tầng

(LĐTĐ) Những đồ vật bất ngờ rơi từ ban công các căn hộ chung cư là nỗi ám ảnh của không ít cư dân. Từ điếu thuốc, tờ giấy, đến bát đũa, thậm chí cả dao, thùng các-tông,… những "vật thể lạ" này không chỉ gây phiền toái mà còn tiềm ẩn nguy cơ tai nạn nghiêm trọng, khiến người dân sống trong lo lắng mỗi lần đi dạo dưới chân các tòa chung cư cao tầng.
Đặc sắc các sản phẩm tại Hội chợ trái cây, nông sản an toàn các tỉnh, thành phố năm 2024

Đặc sắc các sản phẩm tại Hội chợ trái cây, nông sản an toàn các tỉnh, thành phố năm 2024

(LĐTĐ) Thời gian qua, thành phố Hà Nội đã tích cực hỗ trợ các địa phương trong hoạt động quảng bá, giới thiệu, kết nối trái cây, nông sản, đặc sản tại thị trường Hà Nội thông qua trên 70 hoạt động giao thương, hội chợ, tuần hàng...
Tự động hóa quy trình chi trả quyền lợi bảo hiểm với công nghệ OCR thế hệ mới

Tự động hóa quy trình chi trả quyền lợi bảo hiểm với công nghệ OCR thế hệ mới

(LĐTĐ) Công ty TNHH Bảo hiểm Nhân thọ Prudential Việt Nam vừa chính thức giới thiệu công nghệ OCR thế hệ mới (nhận dạng ký tự quang học tích hợp AI tạo sinh) vào quy trình thẩm định và xét duyệt hồ sơ yêu cầu giải quyết quyền lợi bảo hiểm trực tuyến.
Tứ kết UEFA Nations League: Mong chờ cuộc đối đầu giữa Đức và Italy

Tứ kết UEFA Nations League: Mong chờ cuộc đối đầu giữa Đức và Italy

(LĐTĐ) Chiều tối ngày 22/11, UEFA đã tổ chức lễ bốc thăm vòng tứ kết Nations League tại Nyon (Thụy Sĩ).

Tin khác

Chung tay phát triển hệ sinh thái khởi nghiệp sáng tạo Việt Nam

Chung tay phát triển hệ sinh thái khởi nghiệp sáng tạo Việt Nam

(LĐTĐ) Sáng 21/11, Bộ Khoa học và Công nghệ (KH&CN) tổ chức họp báo về Ngày hội khởi nghiệp sáng tạo Việt Nam (TECHFEST) với chủ đề Chung tay phát triển hệ sinh thái khởi nghiệp sáng tạo Việt Nam.
Apple sắp ra mắt thiết bị nhà thông minh kết hợp AI

Apple sắp ra mắt thiết bị nhà thông minh kết hợp AI

(LĐTĐ) Apple dự kiến sẽ ra mắt một thiết bị nhà thông minh hoàn toàn mới vào tháng 3/2025, mang tên mã J490. Thiết bị này tích hợp công nghệ trí tuệ nhân tạo (AI), màn hình 6 inch cảm ứng, camera, pin sạc, và loa tích hợp, cho phép người dùng gắn lên tường hoặc đặt ở các bề mặt trong nhà.
Google thử nghiệm tìm kiếm bằng giọng nói liền mạch và phản hồi cực nhanh

Google thử nghiệm tìm kiếm bằng giọng nói liền mạch và phản hồi cực nhanh

(LĐTĐ) Google đang tiến hành thử nghiệm một tính năng mới cho phép người dùng đặt câu hỏi bằng giọng nói, và nhận câu trả lời ngay lập tức, mở ra trải nghiệm tìm kiếm liền mạch, đặc biệt trên thiết bị di động. Tính năng mới này được kỳ vọng sẽ cải thiện đáng kể khả năng tìm kiếm bằng giọng nói của Google, giúp người dùng dễ dàng đặt các câu hỏi tiếp nối mà không cần phải khởi động lại quá trình tìm kiếm.
Trí tuệ nhân tạo (AI) - Bước đột phá giúp hoàn thiện bản đồ não bộ con người

Trí tuệ nhân tạo (AI) - Bước đột phá giúp hoàn thiện bản đồ não bộ con người

(LĐTĐ) Giáo sư Sebastian Seung từ Đại học Princeton (Mỹ), một chuyên gia hàng đầu trong lĩnh vực não bộ và AI, nhận định rằng nhờ AI, việc lập bản đồ hoàn chỉnh bộ não con người đã trở thành khả thi trong một tương lai không xa. Theo ông, nếu không có AI, nhân loại sẽ phải mất tới 50.000 năm để giải mã toàn bộ cấu trúc phức tạp của bộ não.
MacBook Pro thế hệ tiếp theo, nâng tầm trải nghiệm người dùng

MacBook Pro thế hệ tiếp theo, nâng tầm trải nghiệm người dùng

(LĐTĐ) Apple tiếp tục gây chú ý với những dự định lớn lao cho dòng sản phẩm MacBook Pro, sau khi vừa ra mắt MacBook Pro M4. Công ty không ngừng phát triển và đã lên kế hoạch cho các cải tiến đáng mong đợi vào năm 2026.
Google Maps tích hợp AI Gemini, sẵn sàng trả lời mọi câu hỏi về địa điểm

Google Maps tích hợp AI Gemini, sẵn sàng trả lời mọi câu hỏi về địa điểm

(LĐTĐ) Google Maps vừa nâng cấp tính năng vượt trội với sự hỗ trợ của AI Gemini, giúp người dùng có trải nghiệm du lịch và khám phá địa điểm thông minh, tiện lợi hơn bao giờ hết.
Meta phát triển nền tảng tìm kiếm AI độc lập

Meta phát triển nền tảng tìm kiếm AI độc lập

(LĐTĐ) Meta đang tiến hành xây dựng một công cụ tìm kiếm AI riêng, giúp nâng cao tính tự chủ trong hệ sinh thái và giảm sự phụ thuộc vào các dịch vụ tìm kiếm bên ngoài như Google và Bing. Động thái này đánh dấu bước đi chiến lược của Meta trong việc phát triển nền tảng tìm kiếm AI độc lập, tối ưu hóa trải nghiệm người dùng trên các nền tảng của mình, bao gồm Facebook và Instagram.
Google bổ sung 15 ngôn ngữ bản địa châu Phi vào nền tảng dịch thuật

Google bổ sung 15 ngôn ngữ bản địa châu Phi vào nền tảng dịch thuật

(LĐTĐ) Google vừa công bố việc tích hợp thêm 15 ngôn ngữ bản địa châu Phi vào nền tảng dịch thuật, giúp hơn 300 triệu người trên lục địa này có thể tiếp cận thông tin dễ dàng hơn. Với bản cập nhật mới này, Google hiện có khả năng dịch hơn 94 ngôn ngữ toàn cầu sang 25 ngôn ngữ bản địa châu Phi.
Sắp ra mắt mô hình AI mới mạnh hơn GPT-4 gấp 100 lần

Sắp ra mắt mô hình AI mới mạnh hơn GPT-4 gấp 100 lần

(LĐTĐ) OpenAI, cha đẻ của chatbot ChatGPT nổi tiếng, hiện đang ấp ủ một mô hình AI mới mang tên Orion, dự kiến ra mắt vào tháng 12/2024. Mô hình này được dự báo sẽ có khả năng mạnh mẽ hơn GPT-4 hiện tại gấp 100 lần và được coi là một bước đệm quan trọng trong hành trình phát triển trí tuệ nhân tạo tổng quát (AGI) của OpenAI.
Singapore đầu tư 270 triệu USD đào tạo nhân lực siêu máy tính thế hệ mới!

Singapore đầu tư 270 triệu USD đào tạo nhân lực siêu máy tính thế hệ mới!

(LĐTĐ) Với khoản tài trợ lớn lên đến 270 triệu USD, Trung tâm Siêu máy tính Quốc gia Singapore (NSCC) đang đẩy mạnh đào tạo hàng nghìn chuyên gia công nghệ nhằm chuẩn bị cho thế hệ siêu máy tính tiếp theo. Đây là lần thứ hai Quỹ Nghiên cứu Quốc gia Singapore (NRF) cung cấp tài trợ cho lĩnh vực này, cho thấy cam kết của đất nước trong việc phát triển công nghệ tính toán tiên tiến để đáp ứng nhu cầu ngày càng tăng trong trí tuệ nhân tạo (AI), nghiên cứu biến đổi khí hậu, và chăm sóc sức khỏe.
Xem thêm
Phiên bản di động