Các phương pháp hay nhất khi triển khai trình điều khiển NNAPI

Trang này mô tả các phương pháp hay nhất để triển khai các trình điều khiển Neural Networks API (NNAPI) nhằm cho phép các nhà phát triển ứng dụng áp dụng rộng rãi NNAPI.

Giữ cho thời gian khởi động ngắn

Nếu trình điều khiển của bạn biến đổi trọng số của mô hình trong lần sử dụng đầu tiên, hãy đảm bảo rằng trình điều khiển hỗ trợ tính năng lưu vào bộ nhớ đệm biên dịch, giúp giảm thời gian dùng để biên dịch khi ứng dụng khởi động. Điều này rất quan trọng vì ứng dụng có thể tránh sử dụng tính năng tăng tốc phần cứng nếu thời gian khởi động quá lâu. Ví dụ: một số ứng dụng có trọng số hơn 100 MB và việc chuyển đổi các trọng số này mỗi lần khởi chạy là một cách lãng phí.

Giảm độ trễ tối thiểu

Để đảm bảo các mô hình sử dụng tính năng tăng tốc phần cứng, bạn cần giảm tối thiểu độ trễ trong trình điều khiển. Nhiều ứng dụng sử dụng các mô hình nhỏ được thực thi nhiều lần và nếu độ trễ tối thiểu để thực thi khối lượng công việc quá cao, chẳng hạn như vài mili giây, thì các mô hình có thể chạy khối lượng công việc trên CPU vốn chỉ mất một hoặc hai mili giây, thay vì sử dụng tính năng tăng tốc phần cứng. Thận trọng về việc đồng bộ hoá luồng tốn kém.

Sử dụng nhóm NN HAL SchedTune

Từ Android 11 trở lên, AOSP bao gồm một nhóm NN HAL SchedTune chuyên dụng cho phép các quy trình NN HAL liên quy trình sử dụng các lõi lớn, tương tự như triển khai cùng một quy trình trong nhóm top-app được xác định trước. Việc sử dụng nhóm ScherTune này sẽ giúp giảm mức hao tổn của người lái xe, đặc biệt là đối với các mô hình nhỏ.

Để sử dụng nhóm SchedTune, hãy thêm dòng sau vào tệp init.rc của quy trình NN HAL:

writepid /dev/stune/nnapi-hal/tasks