Sự thay đổi đáng kinh ngạc xảy ra trong cuộc sống của bạn khi bạn quyết định kiểm soát những gì bạn có quyền thay vì khao khát kiểm soát những gì bạn không có.”- Steve Maraboli

Rutuja Kawade, Kỹ sư ML tại Omdena | AI vì lợi ích xã hội phản ánh medium.com dựa trên kinh nghiệm của cô ấy khi làm việc trên Thử thách Omdena iRAP trong những tháng gần đây: Từ thu thập dữ liệu cho EDA, dán nhãn, xây dựng các mô hình ML tinh vi để đánh giá an toàn đường bộ (với một số nhà khoa học dữ liệu, kỹ sư dữ liệu và chuyên gia ML giỏi nhất thế giới):

Sự đổi mới Thử thách Omdena iRAP diễn ra trong 8 tuần kể từ tháng 11 năm 2020 và đã thu hút hơn 50 kỹ sư AI và máy học để tìm ra giải pháp cho việc thu thập và mã hóa dữ liệu thuộc tính đường nhanh chóng và thông minh (AiRAP) để cứu sống.

Là một sinh viên đại học, việc quản lý học viện với một số hoạt động ngoại khóa luôn là một thử thách đối với tôi. Tôi đã luôn cố gắng tận dụng tối đa thời gian rảnh rỗi của mình. Vụ khóa này cũng không ngoại lệ. Từ Học hỏi và Khám phá Học máy đến việc được chọn làm Kỹ sư ML Junior trong Dự án Thị giác Máy tính tại Omdena cho đến việc trở thành Kỹ sư Học máy vào cuối hai tháng đều rất đáng chú ý.

Tiết kiệm cuộc sống cùng nhau
Hai tháng qua không thể hiệu quả hơn việc cộng tác trong một dự án an toàn đường bộ với động cơ #savingliveston và làm việc với một số kỹ sư ML giỏi nhất trên toàn cầu. Tôi rất vui vì đã hoàn thành dự án AI về an toàn đường bộ bằng cách Omdena phối hợp với iRAP. Dự án bắt đầu vào giữa tháng 11 năm 2020 với 50 nhà thay đổi trên toàn cầu. 50 người thay đổi #AI từ 24 quốc gia (33% phụ nữ) đoàn kết để bắt đầu Thử thách An toàn Đường bộ với iRAP.

Tuyên bố vấn đề là Ngăn chặn Tai nạn trên đường và Cứu sống. Bản thân thử thách đã cuốn hút tôi rất nhiều nên tôi rất háo hức bắt đầu mọi thứ.

Vấn đề của chúng tôi là lập bản đồ rủi ro va chạm trên mọi con đường trên trái đất cho từng loại người sử dụng đường; xác định thiết kế cơ sở hạ tầng, tốc độ và các tính năng khối lượng ảnh hưởng đến rủi ro đó và sản xuất dữ liệu thường xuyên để thúc đẩy khả năng hiển thị, trách nhiệm giải trình, hành động và theo dõi hiệu suất.

Hình ảnh LiDAR của Road (Nguồn: TomTom Dataset)

Dự án tập trung vào việc phân tích dữ liệu và các khả năng của nó, trích xuất đặc điểm đường bộ từ dữ liệu hiện có, sản xuất Bản đồ rủi ro về các vụ tai nạn lịch sử, các vụ tai nạn đã đi qua đối với từng người tham gia giao thông, lập bản đồ hiệu suất an toàn và đối phó với Đánh giá sao theo tiêu chuẩn iRAP. Công việc của tôi liên quan đến việc xây dựng các mô hình phát hiện đối tượng với YOLO v3, CV mở, Resnet và COCO.

Từ thu thập dữ liệu đến ghi nhãn
Tôi đã phải đối mặt với độ chính xác của từng thứ và cách chúng tôi có thể tối ưu hóa nó để làm cho nó phù hợp với dữ liệu của chúng tôi. Tôi cũng đã làm việc với các hình ảnh toàn cảnh từ TomTom tập dữ liệu. TomTom Lịch sử Thống kê Giao thông là một sản phẩm tự phục vụ phân tích dữ liệu vị trí lịch sử và cung cấp thông tin chi tiết về giao thông về tốc độ, thời gian di chuyển và kích thước mẫu trên mạng lưới đường. Về cơ bản, nó chứa tất cả các hình ảnh thực tế về đường và giao thông.

Một trong những hình ảnh được thêm vào đây. Chúng tôi chọn tập dữ liệu này vì nó có LiDAR (Phát hiện và đo sáng) cũng như các hình ảnh toàn cảnh giúp chúng tôi phân tích các đặc điểm của đường và cảm thấy thoải mái với các khía cạnh khác nhau của con đường mà iRAP đang xem xét. Tập dữ liệu TomTom không được gắn nhãn và nhóm của chúng tôi đã gắn nhãn nó theo tiêu chuẩn iRAP với khoảng 3.964 hình ảnh (10,9 GB). Nó bao gồm hình ảnh toàn cảnh cho ESP (Hình ảnh đường Tây Ban Nha) và MEX (Hình ảnh đường Mexico).

 

Hình ảnh toàn cảnh (Nguồn: TomTom Dataset)

Thử thách đầu tiên và cũng là thách thức lớn nhất với dữ liệu TomTom đối với tôi là xử lý và xử lý dữ liệu lớn bằng Amazon S3, điều mà tôi chưa từng làm trước đây. Tôi đã nhận được sự hỗ trợ tốt của cộng đồng khi gặp bất kỳ vấn đề nào như thế này. Điều tuyệt vời nhất là một số cộng tác viên khác đang hoạt động không hiệu quả vào bất kỳ thời điểm nào trong ngày mà tôi có thể liên hệ.

Tôi cùng với nhóm đã chú thích hình ảnh theo cách thủ công và chúng tôi sử dụng công cụ ghi nhãn (labelImg). Chúng tôi đã hoàn thành chú thích gần 2K hình ảnh được TomTom chụp. Ngoài ra, tôi đã có cơ hội làm việc trên đường dẫn của dự án bằng Spell ML.

Spell ML là một nền tảng để xây dựng và quản lý các dự án máy học. Nó thường được sử dụng cho các dự án máy học đường ống. Nhóm của chúng tôi đã sử dụng phần mềm này để tổng hợp công việc của mọi cá nhân hoặc nhóm nhỏ để biến nó thành toàn bộ tác phẩm cuối cùng.

Dán nhãn cho hình ảnh Toàn cảnh bằng phần mềm LabelImg

Cộng đồng, Trợ giúp và Cuộc gọi Sprint
Chúng tôi cũng đã có một vài lần chạy mã và chạy nước rút dữ liệu trong đó tất cả các cộng tác viên làm việc trên cùng một phần đang có một phiên tương tác với việc giải quyết các nghi ngờ, giúp đỡ lẫn nhau và thực sự xây dựng một cộng đồng.

Tôi đặc biệt muốn đề cập đến sprint chú thích, nơi tất cả các cộng tác viên liên quan đến nhiệm vụ này tham gia và thảo luận về việc gắn nhãn, phần mềm được sử dụng để chú thích hình ảnh. Chúng tôi chia các hình ảnh cho nhau và tiếp tục chú thích chúng. Nước rút này kéo dài gần 8–10 giờ, nơi mọi người có thể tự do tham gia và rời đi theo múi giờ của họ. Chúng tôi cũng đã có một số cuộc họp khác, nơi mọi người chia sẻ tình trạng công việc của họ, những nghi ngờ và khó khăn gặp phải bất cứ lúc nào, và giúp đỡ lẫn nhau với đầy đủ kiến thức của họ.

Helen Keller đã nói rất đúng: “Một mình, chúng ta có thể làm rất ít; cùng nhau, chúng ta có thể làm được rất nhiều điều ”.

Tôi đã có một trải nghiệm học tập và làm việc tuyệt vời với tất cả những người thay đổi tuyệt vời, những người đã nỗ lực hết mình để hoàn thành công việc này. Ngoài các kỹ năng kỹ thuật của mình, tôi đã cải thiện đáng kể kỹ năng giao tiếp của mình. Tôi đã gặp gỡ nhiều nhà khoa học dữ liệu mới và phi thường trên khắp thế giới, và tôi thực sự nghĩ rằng việc kết bạn làm việc cùng nhau là một thành tựu đối với tôi.

Cộng đồng Omdena là điều tốt nhất mà tôi có thể yêu cầu. Tôi phải giao tiếp với nhiều người thay đổi, nơi tôi học hỏi và khám phá những điều khác biệt mà không thể có được nếu không có sự hỗ trợ của cộng đồng. Học hỏi kinh nghiệm và kiến thức lẫn nhau là yếu tố quan trọng nhất khi nói đến xây dựng nhóm. Điều tuyệt vời nhất là tất cả các cộng tác viên đã chia sẻ kinh nghiệm và kiến thức của họ, rất chắc chắn và tích cực về bất kỳ nhiệm vụ cụ thể nào. Dự án có rất nhiều người đến từ các khu vực khác nhau trên thế giới nhưng tất cả đều đoàn kết như một đội.

Kết lại, tôi có thể nói rằng tôi thực sự rất thích được trở thành thành viên của nhóm này và hiểu rằng việc xây dựng cộng đồng cũng quan trọng như việc học hỏi những điều kỹ thuật, để làm cho việc làm việc theo nhóm thành công!

#ổng hợp #aiforgood #ăng cường an toàn #hiết kế máy tính #a tiết kiệm đầu tư chung #3các tính năng tốt hơn

 

Xin chân thành cảm ơn Rutuja và nhóm iRAP Omdena Challenge! Tham gia các dự án Omdena trong tương lai đây.

In thân thiện, PDF & Email
viTiếng Việt
Chia sẻ cái này

Chia sẻ cái này

Chia sẻ bài này với bạn bè của bạn!