Mạng nơ-ron tích chập (CNN): Dạy máy tính cách nhìn

TÍN DỤNG HÌNH ẢNH:
Tín dụng hình ảnh
iStock

Mạng nơ-ron tích chập (CNN): Dạy máy tính cách nhìn

Mạng nơ-ron tích chập (CNN): Dạy máy tính cách nhìn

Văn bản tiêu đề phụ
Mạng thần kinh tích chập (CNN) đang đào tạo AI để xác định và phân loại hình ảnh và âm thanh tốt hơn.
    • tác giả:
    • tên tác giả
      Tầm nhìn lượng tử
    • 1 Tháng mười hai, 2023

    Tóm tắt thông tin chi tiết

    Mạng thần kinh chuyển đổi (CNN) đóng vai trò then chốt trong phân loại hình ảnh và thị giác máy tính, thay đổi cách máy móc xác định và hiểu dữ liệu hình ảnh. Chúng bắt chước tầm nhìn của con người, xử lý hình ảnh thông qua các lớp chập, gộp và được kết nối đầy đủ để trích xuất và phân tích tính năng. CNN có nhiều ứng dụng đa dạng, bao gồm bán lẻ để giới thiệu sản phẩm, ô tô để cải thiện an toàn, chăm sóc sức khỏe để phát hiện khối u và công nghệ nhận dạng khuôn mặt. Việc sử dụng chúng mở rộng sang phân tích tài liệu, di truyền và phân tích hình ảnh vệ tinh. Với sự hội nhập ngày càng tăng vào các lĩnh vực khác nhau, CNN nêu lên những lo ngại về đạo đức, đặc biệt là liên quan đến công nghệ nhận dạng khuôn mặt và quyền riêng tư dữ liệu, nêu bật sự cần thiết phải xem xét cẩn thận việc triển khai chúng.

    Bối cảnh mạng nơ ron tích chập (CNN)

    CNN là một mô hình học sâu lấy cảm hứng từ cách con người và động vật sử dụng mắt để xác định vật thể. Máy tính không có khả năng này; khi họ “xem” một hình ảnh, nó sẽ được dịch thành chữ số. Do đó, CNN được phân biệt với các mạng thần kinh khác bởi khả năng phân tích dữ liệu tín hiệu hình ảnh và âm thanh tiên tiến. Chúng được thiết kế để học một cách tự động và thích ứng các hệ thống phân cấp không gian của các đối tượng, từ các mẫu cấp thấp đến cấp cao. CNN có thể hỗ trợ máy tính thu được mắt "con người" và cung cấp cho nó tầm nhìn máy tính, cho phép nó hấp thụ tất cả các pixel và số mà nó nhìn thấy, đồng thời hỗ trợ nhận dạng và phân loại hình ảnh. 

    ConvNet triển khai các chức năng kích hoạt trong bản đồ đặc trưng để hỗ trợ máy xác định những gì nó nhìn thấy. Quá trình này được kích hoạt bởi ba lớp chính: lớp chập, lớp gộp và lớp được kết nối đầy đủ. Hai lớp đầu tiên (tích chập và gộp) thực hiện trích xuất dữ liệu, trong khi lớp được kết nối đầy đủ tạo ra đầu ra, chẳng hạn như phân loại. Bản đồ đặc trưng được chuyển từ lớp này sang lớp khác cho đến khi máy tính có thể nhìn thấy toàn bộ bức tranh. CNN được cung cấp càng nhiều thông tin càng tốt để phát hiện các đặc điểm khác nhau. Bằng cách yêu cầu máy tính tìm kiếm các cạnh và đường thẳng, những cỗ máy này học cách xác định hình ảnh nhanh chóng và chính xác với tốc độ mà con người không thể thực hiện được.

    Tác động gián đoạn

    Mặc dù CNN được sử dụng phổ biến nhất cho các nhiệm vụ nhận dạng và phân loại hình ảnh nhưng chúng cũng có thể được sử dụng để phát hiện và phân đoạn. Ví dụ: trong lĩnh vực bán lẻ, CNN có thể tìm kiếm trực quan để xác định và đề xuất những món đồ bổ sung cho tủ quần áo hiện có. Trong ô tô, các mạng này có thể theo dõi những thay đổi về điều kiện đường như phát hiện làn đường để cải thiện độ an toàn. Trong chăm sóc sức khỏe, CNN được sử dụng để xác định tốt hơn các khối u ung thư bằng cách phân chia các tế bào bị tổn thương này khỏi các cơ quan khỏe mạnh xung quanh chúng. Trong khi đó, CNN đã cải tiến công nghệ nhận dạng khuôn mặt, cho phép các nền tảng mạng xã hội nhận dạng người trong ảnh và đưa ra đề xuất gắn thẻ. (Tuy nhiên, Facebook đã quyết định ngừng tính năng này vào năm 2021 với lý do lo ngại về đạo đức ngày càng tăng và các chính sách quy định không rõ ràng về việc sử dụng công nghệ này). 

    Việc phân tích tài liệu cũng có thể được cải thiện nhờ CNN. Họ có thể xác minh một tác phẩm viết tay, so sánh nó với cơ sở dữ liệu về nội dung viết tay, giải thích các từ, v.v. Họ có thể quét các giấy tờ viết tay quan trọng đối với tài chính ngân hàng hoặc phân loại tài liệu cho các viện bảo tàng. Trong di truyền học, các mạng này có thể đánh giá nuôi cấy tế bào để nghiên cứu bệnh bằng cách kiểm tra hình ảnh, lập bản đồ và phân tích dự đoán để hỗ trợ các chuyên gia y tế phát triển các phương pháp điều trị tiềm năng. Cuối cùng, các lớp tích chập có thể hỗ trợ phân loại hình ảnh vệ tinh và nhanh chóng xác định chúng là gì, điều này có thể giúp ích cho việc khám phá không gian.

    Các ứng dụng của mạng nơ ron tích chập (CNN)

    Một số ứng dụng của mạng nơ ron tích chập (CNN) có thể bao gồm: 

    • Tăng cường sử dụng trong chẩn đoán chăm sóc sức khỏe, bao gồm X quang, chụp X-quang và các bệnh di truyền.
    • Việc sử dụng CNN để phân loại các hình ảnh được truyền trực tuyến từ các tàu con thoi và trạm vũ trụ cũng như tàu thám hiểm mặt trăng. Các cơ quan quốc phòng có thể áp dụng CNN cho các vệ tinh giám sát và máy bay không người lái để tự nhận dạng và đánh giá các mối đe dọa an ninh hoặc quân sự.
    • Cải tiến công nghệ nhận dạng ký tự quang học cho văn bản viết tay và nhận dạng hình ảnh.
    • Cải thiện ứng dụng phân loại robot trong kho và cơ sở tái chế.
    • Việc sử dụng chúng trong việc phân loại tội phạm và những người quan tâm từ camera giám sát nội thất hoặc đô thị. Tuy nhiên, phương pháp này có thể bị sai lệch.
    • Nhiều công ty bị đặt câu hỏi về việc sử dụng công nghệ nhận dạng khuôn mặt, bao gồm cả cách họ thu thập và sử dụng dữ liệu.

    Các câu hỏi để bình luận

    • Bạn nghĩ CNN có thể cải thiện thị giác máy tính như thế nào và cách chúng ta sử dụng nó hàng ngày như thế nào?
    • Những lợi ích khác có thể có của việc nhận dạng và phân loại hình ảnh tốt hơn là gì?

    Tham khảo thông tin chi tiết

    Các liên kết phổ biến và liên kết thể chế sau đây đã được tham chiếu cho thông tin chi tiết này: