Kể từ năm 2026, để phù hợp với mô hình phát triển ổn định của nhánh chính và đảm bảo tính ổn định của nền tảng cho hệ sinh thái, chúng tôi sẽ xuất bản mã nguồn lên AOSP vào quý 2 và quý 4. Để tạo và đóng góp cho AOSP, bạn nên sử dụng android-latest-release thay vì aosp-main. Nhánh tệp kê khai android-latest-release sẽ luôn tham chiếu đến bản phát hành gần đây nhất được chuyển đến AOSP. Để biết thêm thông tin, hãy xem bài viết Các thay đổi đối với AOSP.

Lưu nội dung biên dịch vào bộ nhớ đệm

Kể từ Android 10, Neural Networks API (NNAPI) cung cấp các chức năng hỗ trợ lưu trữ tạm thời các cấu phần phần mềm biên dịch, giúp giảm thời gian dùng để biên dịch khi một ứng dụng khởi động. Khi sử dụng chức năng lưu vào bộ nhớ đệm này, trình điều khiển không cần quản lý hoặc dọn dẹp các tệp được lưu vào bộ nhớ đệm. Đây là một tính năng không bắt buộc mà bạn có thể triển khai bằng NN HAL 1.2. Để biết thêm thông tin về hàm này, hãy xem ANeuralNetworksCompilation_setCaching.

Trình điều khiển cũng có thể triển khai tính năng lưu vào bộ nhớ đệm khi biên dịch mà không phụ thuộc vào NNAPI. Bạn có thể triển khai việc này cho dù có sử dụng các tính năng lưu vào bộ nhớ đệm HAL và NDK NNAPI hay không. AOSP cung cấp một thư viện tiện ích cấp thấp (một công cụ lưu vào bộ nhớ đệm). Để biết thêm thông tin, hãy xem phần Triển khai công cụ lưu vào bộ nhớ đệm.

Tổng quan về quy trình công việc

Phần này mô tả các quy trình làm việc chung khi triển khai tính năng lưu vào bộ nhớ đệm của quá trình biên dịch.

Thông tin bộ nhớ đệm được cung cấp và kết quả tìm kiếm trong bộ nhớ đệm

Ứng dụng này truyền một thư mục lưu vào bộ nhớ đệm và một tổng kiểm tra dành riêng cho mô hình.
Thời gian chạy NNAPI tìm kiếm các tệp trong bộ nhớ đệm dựa trên tổng kiểm tra, lựa chọn ưu tiên thực thi và kết quả phân vùng, sau đó tìm thấy các tệp.
NNAPI sẽ mở các tệp trong bộ nhớ đệm và truyền các giá trị nhận dạng đến trình điều khiển bằng prepareModelFromCache.
Trình điều khiển chuẩn bị mô hình trực tiếp từ các tệp trong bộ nhớ đệm và trả về mô hình đã chuẩn bị.

Thông tin bộ nhớ đệm được cung cấp và không tìm thấy trong bộ nhớ đệm

Ứng dụng này truyền một tổng kiểm tra riêng cho mô hình và một thư mục lưu vào bộ nhớ đệm.
Thời gian chạy NNAPI tìm kiếm các tệp lưu vào bộ nhớ đệm dựa trên tổng kiểm tra, lựa chọn ưu tiên thực thi và kết quả phân vùng, nhưng không tìm thấy các tệp lưu vào bộ nhớ đệm.
NNAPI tạo các tệp bộ nhớ đệm trống dựa trên tổng kiểm tra, lựa chọn ưu tiên thực thi và việc phân vùng, mở các tệp bộ nhớ đệm và truyền các giá trị nhận dạng cũng như mô hình đến trình điều khiển bằng prepareModel_1_2.
Trình điều khiển biên dịch mô hình, ghi thông tin lưu vào bộ nhớ đệm vào các tệp bộ nhớ đệm và trả về mô hình đã chuẩn bị.

Không cung cấp thông tin về bộ nhớ đệm

Ứng dụng gọi quy trình biên dịch mà không cung cấp thông tin lưu vào bộ nhớ đệm.
Ứng dụng không truyền bất kỳ thông tin nào liên quan đến việc lưu vào bộ nhớ đệm.
Môi trường thời gian chạy NNAPI truyền mô hình đến trình điều khiển bằng prepareModel_1_2.
Trình điều khiển biên dịch mô hình và trả về mô hình đã chuẩn bị.

Thông tin về bộ nhớ đệm

Thông tin lưu vào bộ nhớ đệm được cung cấp cho trình điều khiển bao gồm một mã thông báo và các trình xử lý tệp bộ nhớ đệm.

Mã thông báo

Mã thông báo là mã thông báo lưu vào bộ nhớ đệm có độ dài Constant::BYTE_SIZE_OF_CACHE_TOKEN, dùng để xác định mô hình đã chuẩn bị. Bạn sẽ nhận được cùng một mã thông báo khi lưu các tệp vào bộ nhớ đệm bằng prepareModel_1_2 và truy xuất mô hình đã chuẩn bị bằng prepareModelFromCache. Ứng dụng của trình điều khiển nên chọn một mã thông báo có tỷ lệ xung đột thấp. Trình điều khiển không phát hiện thấy xung đột mã thông báo. Xung đột dẫn đến việc thực thi không thành công hoặc thực thi thành công nhưng tạo ra các giá trị đầu ra không chính xác.

Xử lý tệp bộ nhớ đệm (hai loại tệp bộ nhớ đệm)

Có 2 loại tệp bộ nhớ đệm là bộ nhớ đệm dữ liệu và bộ nhớ đệm mô hình.

Bộ nhớ đệm dữ liệu: Dùng để lưu vào bộ nhớ đệm dữ liệu hằng số, bao gồm cả vùng đệm tensor đã được xử lý trước và chuyển đổi. Việc sửa đổi bộ nhớ đệm dữ liệu không được gây ra bất kỳ ảnh hưởng nào tệ hơn việc tạo ra các giá trị đầu ra không hợp lệ tại thời gian thực thi.
Bộ nhớ đệm mô hình: Dùng để lưu vào bộ nhớ đệm dữ liệu nhạy cảm về bảo mật, chẳng hạn như mã máy thực thi đã biên dịch ở định dạng nhị phân gốc của thiết bị. Việc sửa đổi bộ nhớ đệm mô hình có thể ảnh hưởng đến hành vi thực thi của trình điều khiển và một ứng dụng độc hại có thể tận dụng điều này để thực thi ngoài quyền được cấp. Do đó, trình điều khiển phải kiểm tra xem bộ nhớ đệm mô hình có bị hỏng hay không trước khi chuẩn bị mô hình từ bộ nhớ đệm. Để biết thêm thông tin, hãy xem phần Bảo mật.

Trình điều khiển phải quyết định cách phân phối thông tin trong bộ nhớ đệm giữa hai loại tệp bộ nhớ đệm và báo cáo số lượng tệp bộ nhớ đệm cần thiết cho mỗi loại bằng getNumberOfCacheFilesNeeded.

Môi trường thời gian chạy NNAPI luôn mở các chỉ số mô tả tệp bộ nhớ đệm bằng cả quyền đọc và ghi.

Bảo mật

Trong quá trình lưu vào bộ nhớ đệm khi biên dịch, bộ nhớ đệm mô hình có thể chứa dữ liệu nhạy cảm về bảo mật, chẳng hạn như mã máy thực thi đã biên dịch ở định dạng nhị phân gốc của thiết bị. Nếu không được bảo vệ đúng cách, việc sửa đổi bộ nhớ đệm mô hình có thể ảnh hưởng đến hành vi thực thi của trình điều khiển. Vì nội dung trong bộ nhớ đệm được lưu trữ trong thư mục ứng dụng nên máy khách có thể sửa đổi các tệp trong bộ nhớ đệm. Một ứng dụng có lỗi có thể vô tình làm hỏng bộ nhớ đệm và một ứng dụng độc hại có thể cố ý sử dụng bộ nhớ đệm này để thực thi mã chưa xác minh trên thiết bị. Tuỳ thuộc vào đặc điểm của thiết bị, đây có thể là một vấn đề bảo mật. Do đó, trình điều khiển phải có khả năng phát hiện lỗi hỏng bộ nhớ đệm mô hình tiềm ẩn trước khi chuẩn bị mô hình từ bộ nhớ đệm.

Một cách để thực hiện việc này là trình điều khiển duy trì một bản đồ từ mã thông báo đến một hàm băm mật mã của bộ nhớ đệm mô hình. Trình điều khiển có thể lưu trữ mã thông báo và hàm băm của bộ nhớ đệm mô hình khi lưu quá trình biên dịch vào bộ nhớ đệm. Trình điều khiển sẽ kiểm tra hàm băm mới của bộ nhớ đệm mô hình bằng cặp mã thông báo và hàm băm đã ghi khi truy xuất quá trình biên dịch từ bộ nhớ đệm. Mối liên kết này phải duy trì trong suốt quá trình khởi động lại hệ thống. Trình điều khiển có thể sử dụng dịch vụ kho khoá Android, thư viện tiện ích trong framework/ml/nn/driver/cache hoặc bất kỳ cơ chế phù hợp nào khác để triển khai trình quản lý ánh xạ. Sau khi cập nhật trình điều khiển, bạn nên khởi động lại trình quản lý ánh xạ này để tránh chuẩn bị các tệp bộ nhớ đệm từ phiên bản trước.

Để ngăn chặn các cuộc tấn công thời gian kiểm tra đến thời gian sử dụng (TOCTOU), trình điều khiển phải tính toán hàm băm đã ghi trước khi lưu vào tệp và tính toán hàm băm mới sau khi sao chép nội dung tệp vào bộ nhớ đệm nội bộ.

Mã mẫu này minh hoạ cách triển khai logic này.

bool saveToCache(const sp<V1_2::IPreparedModel> preparedModel,
                 const hidl_vec<hidl_handle>& modelFds, const hidl_vec<hidl_handle>& dataFds,
                 const HidlToken& token) {
    // Serialize the prepared model to internal buffers.
    auto buffers = serialize(preparedModel);

    // This implementation detail is important: the cache hash must be computed from internal
    // buffers instead of cache files to prevent time-of-check to time-of-use (TOCTOU) attacks.
    auto hash = computeHash(buffers);

    // Store the {token, hash} pair to a mapping manager that is persistent across reboots.
    CacheManager::get()->store(token, hash);

    // Write the cache contents from internal buffers to cache files.
    return writeToFds(buffers, modelFds, dataFds);
}

sp<V1_2::IPreparedModel> prepareFromCache(const hidl_vec<hidl_handle>& modelFds,
                                          const hidl_vec<hidl_handle>& dataFds,
                                          const HidlToken& token) {
    // Copy the cache contents from cache files to internal buffers.
    auto buffers = readFromFds(modelFds, dataFds);

    // This implementation detail is important: the cache hash must be computed from internal
    // buffers instead of cache files to prevent time-of-check to time-of-use (TOCTOU) attacks.
    auto hash = computeHash(buffers);

    // Validate the {token, hash} pair by a mapping manager that is persistent across reboots.
    if (CacheManager::get()->validate(token, hash)) {
        // Retrieve the prepared model from internal buffers.
        return deserialize<V1_2::IPreparedModel>(buffers);
    } else {
        return nullptr;
    }
}

Các trường hợp sử dụng nâng cao

Trong một số trường hợp sử dụng nâng cao, trình điều khiển cần có quyền truy cập vào nội dung trong bộ nhớ đệm (đọc hoặc ghi) sau lệnh gọi biên dịch. Ví dụ về các trường hợp sử dụng:

Biên dịch tức thì: Quá trình biên dịch sẽ bị trì hoãn cho đến lần thực thi đầu tiên.
Biên dịch nhiều giai đoạn: Ban đầu, quá trình biên dịch nhanh sẽ được thực hiện và quá trình biên dịch được tối ưu hoá (không bắt buộc) sẽ được thực hiện vào thời điểm sau đó, tuỳ thuộc vào tần suất sử dụng.

Để truy cập vào nội dung trong bộ nhớ đệm (đọc hoặc ghi) sau lệnh gọi biên dịch, hãy đảm bảo rằng trình điều khiển:

Sao chép các xử lý tệp trong quá trình gọi prepareModel_1_2 hoặc prepareModelFromCache và đọc/cập nhật nội dung trong bộ nhớ đệm vào thời điểm khác.
Triển khai logic khoá tệp bên ngoài lệnh gọi biên dịch thông thường để ngăn việc ghi xảy ra đồng thời với một thao tác đọc hoặc một thao tác ghi khác.

Triển khai một công cụ lưu vào bộ nhớ đệm

Ngoài giao diện lưu vào bộ nhớ đệm biên dịch NN HAL 1.2, bạn cũng có thể tìm thấy một thư viện tiện ích lưu vào bộ nhớ đệm trong thư mục frameworks/ml/nn/driver/cache. Thư mục con nnCache chứa mã bộ nhớ liên tục để trình điều khiển triển khai tính năng lưu vào bộ nhớ đệm khi biên dịch mà không cần dùng các tính năng lưu vào bộ nhớ đệm của NNAPI. Bạn có thể triển khai hình thức lưu vào bộ nhớ đệm biên dịch này bằng bất kỳ phiên bản nào của NN HAL. Nếu trình điều khiển chọn triển khai tính năng lưu vào bộ nhớ đệm không kết nối với giao diện HAL, thì trình điều khiển sẽ chịu trách nhiệm giải phóng các cấu phần phần mềm được lưu vào bộ nhớ đệm khi không còn cần thiết nữa.