Trang này mô tả các phương pháp hay nhất để triển khai trình điều khiển Neural Networks API (NNAPI) nhằm cho phép nhà phát triển ứng dụng sử dụng rộng rãi NNAPI.
Giữ cho thời gian khởi động ngắn
Nếu trình điều khiển của bạn biến đổi trọng số của mô hình trong lần sử dụng đầu tiên, hãy đảm bảo trình điều khiển hỗ trợ tính năng lưu vào bộ nhớ đệm biên dịch để giảm thời gian dùng cho quá trình biên dịch khi ứng dụng khởi động. Điều này rất quan trọng vì ứng dụng có thể tránh sử dụng tính năng tăng tốc phần cứng nếu thời gian khởi động quá dài. Ví dụ: một số ứng dụng có trọng số hơn 100 MB và việc chuyển đổi các trọng số này mỗi khi ứng dụng khởi chạy sẽ gây lãng phí.
Giảm độ trễ tối thiểu
Để đảm bảo các mô hình sử dụng tính năng tăng tốc phần cứng, bạn cần giảm tối thiểu độ trễ trong trình điều khiển. Nhiều ứng dụng sử dụng các mô hình nhỏ được thực thi nhiều lần và nếu độ trễ tối thiểu để thực thi khối lượng công việc quá cao, chẳng hạn như vài mili giây, thì các mô hình có thể chạy khối lượng công việc trên CPU, chỉ mất một hoặc hai mili giây thay vì sử dụng tính năng tăng tốc phần cứng. Hãy cẩn thận với việc đồng bộ hoá luồng tốn kém.
Sử dụng nhóm NN HAL SchedTune
Từ Android 11 trở lên, AOSP bao gồm một nhóm NN HAL SchedTune chuyên dụng cho phép các quy trình NN HAL liên quy trình sử dụng các lõi lớn, tương tự như triển khai cùng một quy trình trong nhóm top-app
được xác định trước. Việc sử dụng nhóm SchedTune này sẽ giúp giảm mức hao tổn của người lái xe, đặc biệt là đối với các mô hình nhỏ.
Để sử dụng nhóm SchedTune, hãy thêm dòng sau vào tệp init.rc
của quy trình NN HAL:
writepid /dev/stune/nnapi-hal/tasks