BNEWS Chỉ vài năm trước đây, những chiếc điện thoại thông minh (smartphone) tầm trung có hiệu suất khá thấp và kém xa những sản phẩm smartphone cao cấp.
Ngày nay, chúng có thể hoạt động tốt như những chiếc smartphone cao cấp ra mắt trước đó chỉ 1-2 năm.
Tất cả là nhờ sự phát triển vượt bậc của chip nhớ tích hợp những công nghệ phụ trợ như Trí tuệ nhân tạo (AI) và học máy (machine learning) trên thiết bị di động. Và những bước tiến dài trong các công nghệ trên đã mang đến những trải nghiệm hết sức thú vị cho thế giới smartphone.
* Cải thiện chất lượng hình ảnh
Dấu ấn đáng chú ý nhất của AI và học máy trên smartphone chính là nâng cao hiệu suất của camera. Các nhà sản xuất nhận ra rằng công nghệ này có thể giúp thu hẹp khoảng cách giữa chất lượng hình ảnh của smartphone và máy ảnh chuyên dụng, ngay cả khi phần cứng của smartphone kém hơn.
Giữa những năm 2010 thế giới chứng kiến một cuộc chạy đua trong toàn ngành về cải thiện chất lượng hình ảnh của camera trên smartphone qua từng năm. Đây là yếu tố kích thích chính cho việc áp dụng học máy trên thiết bị di động.
Đến năm 2017, Qualcomm, Google, Apple và Huawei đều đã phát hành chip hoặc smartphone tích hợp bộ tăng tốc dành riêng cho học máy. Kể từ đó, máy ảnh trên smartphone đã được cải thiện đáng kể, đặc biệt là về dải động, giảm nhiễu và chụp ảnh thiếu sáng.
Gần đây, các nhà sản xuất như Samsung Electronics và Xiaomi đã phát triển nhiều ứng dụng mới cho công nghệ này. Ví dụ: tính năng Single Take của Samsung sử dụng công nghệ máy học để tự động tạo album ảnh chất lượng cao từ một video dài 15 giây. Công nghệ của Xiaomi đã phát triển từ chỉ đơn thuần phát hiện các đối tượng trong ảnh sang thay thế toàn bộ nền trời nếu người dùng muốn.
Nhiều nhà sản xuất smartphone hiện cũng sử dụng công nghệ máy học để tự động gắn thẻ các đối tượng trong thư viện của thiết bị. Đây là một tính năng trước đây chỉ có mặt trên những dịch vụ đám mây như Google Photos.
* Dự đoán văn bản
Tất nhiên, công nghệ học máy trên smartphone không chỉ giới hạn trong tác nghiệp nhiếp ảnh. Có thể nói, các ứng dụng liên quan đến văn bản có ứng dụng công nghệ này đã tồn tại khá lâu, nếu không muốn nói là lâu hơn ứng dụng về máy ảnh.
Swiftkey có lẽ là bên đầu tiên sử dụng học máy để tạo ứng dụng gợi ý từ cho người dùng vào năm 2015. Công ty tuyên bố rằng họ đã đào tạo mô hình của mình trên hàng triệu câu khác nhau để hiểu rõ hơn mối quan hệ giữa các từ ngữ.
Một tính năng nổi bật khác xuất hiện sau đó vài năm trên hệ điều hành cho các thiết bị đeo Android Wear 2.0 (nay là Wear OS) có khả năng dự đoán câu trả lời liên quan cho các tin nhắn. Google sau đó đã đặt tên cho tính năng này là Smart Reply và đưa nó vào hệ điều hành Android 10.
*Nhận dạng giọng nói
Trong khi học máy đã đưa chất lượng hình ảnh và dự đoán văn bản trên thiết bị di động có những bước tiến vượt bậc, nhận dạng giọng nói và thị giác máy tính (computer vision) là hai lĩnh vực vẫn còn nhiều dư địa để phát triển và đang có những cải thiện ấn tượng.
Lấy ví dụ như tính năng dịch nhanh qua máy ảnh của Google. Tính năng này sẽ dịch và hiển thị văn bản theo thời gian thực ngay trên máy ảnh đang mở của người dùng. Mặc dù kết quả chưa chính xác bằng tính năng dịch văn bản truyền thống, nhưng nó vẫn có nhiều ứng dụng được đối với những du khách ra nước ngoài và có gói dữ liệu di động hạn chế.
Trong khi đó, tính năng nhận dạng giọng nói và chính tả đều đã xuất hiện từ hơn một thập kỷ qua. Song phải đến năm 2019, smartphone mới có thể thực hiện chúng hoàn toàn offline nhờ công nghệ học máy.
Ví dụ nổi bật nhất là ứng dụng Recorder của Google có thể tự động ghi lại giọng nói trong thời gian thực. Bản ghi âm được lưu trữ dưới dạng văn bản có thể chỉnh sửa và tìm kiếm – một tiện ích lớn cho các nhà báo và sinh viên.
Công nghệ tương tự cũng hỗ trợ Live Caption, một tính năng trên hệ điều hành Android 10 có thể tự động tạo phụ đề cho bất kỳ video nào đang phát trên điện thoại của người dùng. Ngoài việc đóng vai trò như một chức năng hỗ trợ người khuyết tật, nó có thể hữu ích nếu bạn đang cố gắng ghi lại nội dung một đoạn hội thoại trong môi trường ồn ào.
Tính năng nhận dạng giọng nói được cải thiện có thể cho phép người dùng tương tác nhanh hơn với các trợ lý ảo, ngay cả đối với những người có giọng không phổ thông. Hiện Trợ lý ảo Google tuy có khả năng xử lý lệnh thoại trên thiết bị, song chỉ giới hạn cho dòng Pixel của công ty. Dù vậy, nó cho thấy triển vọng cho tương lai của công nghệ này.
Trên đây đều là những tính năng thú vị mà học máy đã mang đến cho thế giới smartphone, nhưng chúng vẫn còn nhiều dư địa để phát triển hơn nữa. Giới phân tích cho rằng hiện ứng dụng học máy trên smartphone vẫn bị giới hạn khá nhiều vì hạn chế về bộ cứng, dung lượng, pin và khả năng xử lý của chip điện thoại.
Mặc dù thực tế đáng tiếc đó sẽ không thay đổi trong một sớm một chiều, nhưng vẫn có nhiều lý do để lạc quan về thập kỷ tiếp theo của công nghệ học máy trên thiết bị di động, nhất là khi những “người khổng lồ” công nghệ tiếp tục chú ý đầu tư cho lĩnh vực còn nhiều tiềm năng này./.
Source: BNews