Khoa học máy tính xuất hiện thay đổi hoàn toàn thế giới của chúng ta. Có khá nhiều lĩnh vực có thể nghiên cứu liên quan đến khoa học máy tính. Qua bài viết này chúng ta sẽ cùng nhau tìm hiểu về thị giác máy tính computer vision nhé!

Thị giác máy tính là một lĩnh vực trong Artificial Intelligence Trí tuệ nhân tạo) và Computer Science (Khoa học máy tính) nhằm giúp máy tính có được khả năng nhìn và hiểu giống như con người.

Thị giác máy tính (computer vision) được định nghĩa là một lĩnh vực bao gồm các phương pháp thu nhận, xử lý ảnh kỹ thuật số, phân tích và nhận dạng các hình ảnh và, nói chung là dữ liệu đa chiều từ thế giới thực để cho ra các thông tin số hoặc biểu tượng. Thị giác máy tính cũng được mô tả là sự tổng thể của một dải rộng các quá trình tự động và tích hợp và các thể hiện cho các nhận thức thị giác

Quà trình mô phỏng thị giác con người được chia thành 3 giai đoạn nối tiếp (tương tự cách con người nhìn): mô phỏng mắt (thu nhận - khó), mô phỏng vỏ não thị giác (xử lý - rất khó) và mô phỏng phần còn lại của bộ não (phân tích - khó nhất).

Thu nhận

Mô phỏng mắt là lĩnh vực đạt được nhiều thành công nhất. Chúng ta đã tạo ra các cảm biến, vi xử lý hình ảnh giống khả năng nhìn của mắt người và thậm chí còn tốt hơn.

Camera có thể chụp hàng ngàn ảnh mỗi giây và nhận diện từ xa với độ chính xác cao. Tuy nhiên cảm biến camera tốt nhất cũng không thể nhận diện được một quả bóng chứ đừng nói là bắt được chúng. Nói cách khác, phần cứng bị giới hạn khi không có phần mềm - đến giờ vẫn là khó khăn lớn nhất. Tuy vậy, camera ngày nay cũng khá linh hoạt và làm nền tảng tốt để nghiên cứu.

Mô tả

Bộ não được xây dựng từ con số 0 với các hình ảnh dần dần lấp đầy tâm trí, nó làm nhiệm vụ liên quan tới thị giác nhiều hơn bất kì công việc nào khác và việc này đều xuống tới cấp độ tế bào. Hàng tỉ tế bào phối hợp để lấy ra các hình mẫu, bắt được tín hiệu.

Một nhóm nơ-ron sẽ báo cho nhóm khác khi có sự khác biệt dọc theo một đường thẳng (theo một góc nào đó, như chuyển động nhanh hơn hay theo một hướng khác). Nghiên cứu đầu tiên về thị giác máy tính cho rằng mạng lưới nơ-ron phức tạp tới nỗi không thể hiểu nổi khi tiếp cận theo hướng lý giải từ trên xuống dưới. Với một số đối tượng thì cách này cũng hiệu quả nhưng khi mô tả từng đối tượng, từ nhiều góc nhìn, nhiều biến thể về màu sắc, chuyển động và nhiều thứ khác thì hãy hình dung sẽ khó thế nào. Ngay cả mức nhận thức của một em bé cũng sẽ cần lượng dữ liệu lớn vô cùng. Cách tiếp cận từ dưới lên bắt chước cách não bộ hoạt động có vẻ hứa hẹn hơn. Những năm qua chứng kiến sự bùng nổ của các nghiên cứu và sử dụng hệ thống này trong việc bắt chước não người. Quá trình nhận diện hình mẫu vẫn đang tăng tốc và chúng ta vẫn liên tục đạt được tiến bộ.

Thấu hiểu

Ta có thể xây dựng một hệ thống nhận diện được một quả táo, từ bất cứ góc nào, trong bất kì tình huống nào, dù đứng im hay chuyển động nhưng chúng không thể nhận diện được một quả cam, không thể nói cho ta quả táo là gì, có ăn được không, lớn nhỏ ra sao hay dùng để làm gì. Như vậy phần cứng và phần mềm tốt cũng không làm được gì nếu không có hệ điều hành.

Đó chính là phần còn lại của bộ não: bộ nhớ ngắn/dài hạn, dữ liệu từ các giác quan, sự chú ý, nhận thức, bài học khi tương tác với thế giới… được viết lên mạng lưới nơ-ron kết nối phức tạp hơn bất cứ thứ gì chúng ta từng thấy, theo cách mà chúng ta không thể hiểu. Đó là nơi mà khoa học máy tính và trí tuệ nhân tạo gặp mặt.

Dù mới trong thời kì sơ khai, thị giác máy tính vẫn vô cùng hữu ích. Nó có mặt trong camera nhận diện khuôn mặt (Face ID) và nụ cười. Nó giúp xe tự lái nhận diện biển báo, người đi đường. Nó nằm trong các robot trong nhà máy, nhận diện sản phẩm, truyền cho con người.

Xem thêm:

Trên đây là một số tìm hiểu về thị giác máy tính. Hi vọng qua bài viết này các bạn đã có thêm những kiến thức mới mẻ và hữu ích. Có thắc mắc hay cần thêm thông tin gì các bạn liên hệ BKAII nhé!

"BKAII - Thiết bị truyền thông TỐT nhất với giá CẠNH TRANH nhất!"

 


Bài viết mới cập nhật...

 
 

Số lượng người đang truy cập...

Đang có 655 khách và không thành viên đang online