Show HN: Signet – Theo dõi cháy rừng tự động từ dữ liệu vệ tinh và thời tiết
Show HN: Signet – Autonomous wildfire tracking from satellite and weather data
Anh em dev ơi, có một dự án tên là Signet, được xây dựng bằng Go, cực hay ho về tự động hóa việc theo dõi cháy rừng. Thay vì phải ngồi "vồ ếch" qua đủ loại dữ liệu vệ tinh, thời tiết thủ công, Signet sẽ gom hết lại, xử lý và đưa ra thông tin cần thiết. Qua dự án này, anh em có thể học được cách kết hợp giữa các *deterministic data pipelines* quen thuộc và việc sử dụng *LLM orchestration* để xử lý dữ liệu "lộn xộn" từ nhiều nguồn khác nhau, rồi đưa ra quyết định cho các bài toán thực tế. Quan trọng là, dự án cũng chỉ ra những điểm cần cân nhắc giữa việc tự động hóa hoàn toàn và giữ lại sự giám sát của con người. Đặc biệt, Signet nhấn mạnh hai điểm: 1. **Thách thức của việc hợp nhất dữ liệu:** Làm sao để gom và chuẩn hóa thông tin từ các nguồn khác nhau là cả một vấn đề đấy. 2. **Tiềm năng của LLM:** Các mô hình ngôn ngữ lớn có thể giúp tổng hợp thông tin "nhiễu", cập nhật liên tục để đưa ra những *actionable insights* (thông tin hành động được) vô cùng giá trị.
Tất cả dữ liệu đã tồn tại: phát hiện nhiệt của NASA FIRMS, hình ảnh GOES-19, dự báo NWS, mô hình nhiên liệu LANDFIRE, độ cao USGS, dữ liệu điều tra dân số, OpenStreetMap. Vấn đề là nó đến từ các nguồn khác nhau ở các nhịp khác nhau ở các định dạng khác nhau.
Hầu hết hệ thống là hệ thống ống nước xác định - nhập, lập chỉ mục không gian, loại bỏ trùng lặp. Tôi sử dụng Gemini để sắp xếp 23 công cụ về thời tiết, địa hình, hình ảnh và theo dõi sự cố cho phần mà các quy tắc rõ ràng bị phá vỡ: quyết định những phát hiện yếu nào đáng điều tra, bối cảnh nào cần kéo tiếp theo và cách tổng hợp bằng chứng ồn ào vào một đánh giá có cấu trúc.
Nó cũng ghi lại các dự đoán có giới hạn thời gian và chấm điểm chúng dựa trên dữ liệu sau này, vì vậy, hệ thống sẽ đưa ra các tuyên bố có thể sai lệch thay vì tường thuật sau khi thực tế xảy ra. Các số liệu dự đoán hiện tại hiển thị trên trang web mặc dù mẫu vẫn còn nhỏ.
Nó đã mở ra các sự cố từ việc phát hiện vệ tinh thô và khớp một số sự cố với báo cáo chính thức của NIFC. Tuy nhiên, kết quả dương tính giả, độ trễ phát hiện và việc so khớp sự cố vẫn có thể gặp khó khăn.
Tôi đặc biệt hoan nghênh những lời chỉ trích về: điều này nên mang tính quyết định hơn thay vì do LLM điều khiển ở đâu? Và liệu kiểu giám sát tự động này có thực sự hữu ích hay chỉ ồn ào hơn so với việc thực hiện bằng tay?
Tác giả: mapldx