הרצת מספר משימות רציפות ותורים מהירים של הודעות

Neural Networks HAL 1.2 מציג את המושג של ביצוע רצפי מודעות. רצף הפעלות הן רצף של הפעלות של אותו מודל מוכן שמתרחשות במהירות רבה, למשל כאלה שפועלים על פריימים של צילום במצלמה אודיו עוקב דוגמאות. אובייקט רצף (bursts) משמש לשליטה בקבוצה של הרצת רצף רצף. לשמר משאבים בין הפעלות, וכך לאפשר לפעולות בתקורה. אובייקטים של רצף רציף מאפשרים לבצע שלוש אופטימיזציות:

  1. אובייקט רצף נוצר לפני רצף של הפעלות ושחרורו כשהרצף מסתיים. לכן, משך החיים של התפרצות לנהג שרומז לנהג כמה זמן הוא צריך להישאר .
  2. אובייקט רצף יכול לשמר משאבים בין הפעלות. לדוגמה, מנהל התקן יכול למפות אובייקט זיכרון בהפעלה הראשונה ולשמור את המיפוי במטמון באובייקט ברצף לצורך שימוש חוזר בהפעלות הבאות. כל משאב שנשמר במטמון ניתן לשחרר כאשר אובייקט הרצף מושמד או כאשר ה-NNAPI סביבת זמן הריצה מודיעה לאובייקט הרצף שהמשאב אינו נדרש יותר.
  3. אובייקט רצף משתמש תורים מהירים להודעות (FMQ) לתקשורת בין האפליקציה ותהליכי הנהג. מי יכול מפחיתים את זמן האחזור כי ה-FMQ עוקף את HIDL ומעביר את הנתונים ישירות אל תהליך נוסף דרך FIFO מעגלי אטומי בזיכרון משותף. יודע להוציא פריט לתור ולהתחיל לעבד אותו דגימה של מספר הרכיבים ב-FIFO או על ידי המתנה לאירוע של ה-FMQ דגל, שמציין המפיק. סימון אירוע זה הוא מהיר userspace mutex (futex).

FMQ הוא מבנה נתונים ברמה נמוכה שלא מציע התחייבות לכל החיים ואין לו מנגנון מובנה כדי לקבוע אם התהליך הקצה השני של ה-FMQ פועל כמצופה. כתוצאה מכך, אם המפיק של שה-FMQ מת, הצרכן עלול להיות תקוע ומחכה לנתונים שלא מגיעים. אחת לפתרון הבעיה הזו הוא שהנהג ישייך ערוצי FMQ אובייקט רצף ברמה גבוהה יותר כדי לזהות מתי ביצוע הרצף הסתיים.

כי הפעלות רצפים פועלות על אותם ארגומנטים ומחזירות אותם תוצאות כמו נתיבי הפעלה אחרים, ערוצי ה-FMQ הבסיסיים חייבים להעביר את אותם נתונים ומנהלי ההתקנים של שירות NNAPI. עם זאת, ממשקי FMQ יכולים להעביר רק סוגי נתונים ישנים. העברת נתונים מורכבים מתבצעת באמצעות סריאליזציה ועושים דה-סריאליזציה של מאגרי נתונים זמניים מקוננים (סוגי וקטורים) ישירות ב-FMQ, באמצעות אובייקטים של קריאה חוזרת (callback) מסוג HIDL להעברת כינויים של מאגרי זיכרון על פי דרישה. המפיק בצד של ה-FMQ, יש לשלוח לצרכן את ההודעות על הבקשה או התוצאה אטומית באמצעות MessageQueue::writeBlocking אם התור חוסם, או באמצעות MessageQueue::write אם התור אינו חוסם.

ממשקי Burst

ממשקי ברצף עבור רשתות הנוירונים עם HAL נמצאים hardware/interfaces/neuralnetworks/1.2/ והם מתוארים בהמשך. למידע נוסף על ממשקים ברצף ב-NDK בשכבת זרימת הנתונים: frameworks/ml/nn/runtime/include/NeuralNetworks.h

segments.hal

types.hal מגדיר את סוג הנתונים שנשלחים דרך ה-FMQ.

  • FmqRequestDatum: רכיב יחיד של ייצוג טורי של ביצוע Request אובייקט וערך MeasureTiming, שנשלחים דרך ההודעה המהירה לרשימת 'הבאים בתור'.
  • FmqResultDatum: רכיב יחיד של ייצוג סידורי של הערכים המוחזרים הפעלה (ErrorStatus, OutputShapes ו-Timing), כלומר שחוזרים מהתור של ההודעות המהירות.

IBurstContext.hal

IBurstContext.hal מגדיר את אובייקט הממשק HIDL שנמצא בשירות של רשתות הנוירונים.

  • IBurstContext: אובייקט הקשר לניהול המשאבים של רצף נתונים.

IBurstCallback.hal

IBurstCallback.hal מגדיר את אובייקט הממשק HIDL עבור קריאה חוזרת (callback) שנוצרה על ידי רשתות הנוירונים סביבת זמן ריצה, והיא משמשת את שירות רשתות הנוירונים כדי לאחזר hidl_memory אובייקטים שתואמים למזהי משבצות.

  • IBurstCallback: אובייקט קריאה חוזרת שמשמש שירות לאחזור אובייקטים של זיכרון.

IPreparedModel.hal

IPreparedModel.hal מורחבת ב-HAL 1.2 עם שיטה ליצירת אובייקט IBurstContext שעבר אימון מראש.

  • configureExecutionBurst: המדיניות הזו מגדירה אובייקט רצף שמשמש לביצוע כמה מסקנות במהירות רבה.

תמיכה בביצוע רצפים במנהל התקן

הדרך הפשוטה ביותר לתמוך באובייקטים ברצף בשירות HIDL NNAPI היא להשתמש פונקציית רצף התשתיות ::android::nn::ExecutionBurstServer::create, שהיא נמצא ב ExecutionBurstServer.h ארוזים בlibneuralnetworks_common וlibneuralnetworks_util של ספריות סטטיות. לפונקציה של היצרן יש שני עומסי יתר:

  • עומס יתר אחד מקבל מצביע לאובייקט IPreparedModel. הזה פונקציית השירות משתמשת ב-method executeSynchronously IPreparedModel כדי להפעיל את המודל.
  • עומס יתר אחד מקבל אובייקט IBurstExecutorWithCache שניתן להתאמה אישית, שאפשר להשתמש בה כדי לשמור במטמון משאבים (כמו מיפויים של hidl_memory) מופיעים בכמה ניסיונות הפעלה.

כל עומס יתר מחזיר אובייקט IBurstContext (שמייצג את הרצף (burst) שמכיל ומנהל את ה-threads הייעודי שלו. השרשור הזה מקבל בקשות מ-FMQ requestChannel, מבצע את ההסקה, ואז מחזירה את התוצאות באמצעות ה-FMQ של resultChannel. השרשור הזה וכל שאר ההודעות המשאבים הכלולים באובייקט IBurstContext משוחררים באופן אוטומטי כשהלקוח של תמונת האירוע מאבד את ההפניה אל IBurstContext.

לחלופין, אתם יכולים ליצור יישום משלכם של IBurstContext, מבין איך לשלוח ולקבל הודעות באמצעות requestChannel resultChannel תדרי FMQ הועברו אל IPreparedModel::configureExecutionBurst.

פונקציות השימוש ברצף (burst) נמצאות ב- ExecutionBurstServer.h

/**
 * Create automated context to manage FMQ-based executions.
 *
 * This function is intended to be used by a service to automatically:
 * 1) Receive data from a provided FMQ
 * 2) Execute a model with the given information
 * 3) Send the result to the created FMQ
 *
 * @param callback Callback used to retrieve memories corresponding to
 *     unrecognized slots.
 * @param requestChannel Input FMQ channel through which the client passes the
 *     request to the service.
 * @param resultChannel Output FMQ channel from which the client can retrieve
 *     the result of the execution.
 * @param executorWithCache Object which maintains a local cache of the
 *     memory pools and executes using the cached memory pools.
 * @result IBurstContext Handle to the burst context.
 */
static sp<ExecutionBurstServer> create(
        const sp<IBurstCallback>& callback, const FmqRequestDescriptor& requestChannel,
        const FmqResultDescriptor& resultChannel,
        std::shared_ptr<IBurstExecutorWithCache> executorWithCache);

/**
 * Create automated context to manage FMQ-based executions.
 *
 * This function is intended to be used by a service to automatically:
 * 1) Receive data from a provided FMQ
 * 2) Execute a model with the given information
 * 3) Send the result to the created FMQ
 *
 * @param callback Callback used to retrieve memories corresponding to
 *     unrecognized slots.
 * @param requestChannel Input FMQ channel through which the client passes the
 *     request to the service.
 * @param resultChannel Output FMQ channel from which the client can retrieve
 *     the result of the execution.
 * @param preparedModel PreparedModel that the burst object was created from.
 *     IPreparedModel::executeSynchronously will be used to perform the
 *     execution.
 * @result IBurstContext Handle to the burst context.
 */
  static sp<ExecutionBurstServer> create(const sp<IBurstCallback>& callback,
                                         const FmqRequestDescriptor& requestChannel,
                                         const FmqResultDescriptor& resultChannel,
                                         IPreparedModel* preparedModel);

הדוגמה הבאה היא הטמעת הפניה של ממשק רצף, שנמצא ב- מנהל התקן לדוגמה של רשתות נוירונים ב- frameworks/ml/nn/driver/sample/SampleDriver.cpp

Return<void> SamplePreparedModel::configureExecutionBurst(
        const sp<V1_2::IBurstCallback>& callback,
        const MQDescriptorSync<V1_2::FmqRequestDatum>& requestChannel,
        const MQDescriptorSync<V1_2::FmqResultDatum>& resultChannel,
        configureExecutionBurst_cb cb) {
    NNTRACE_FULL(NNTRACE_LAYER_DRIVER, NNTRACE_PHASE_EXECUTION,
                 "SampleDriver::configureExecutionBurst");
    // Alternatively, the burst could be configured via:
    // const sp<V1_2::IBurstContext> burst =
    //         ExecutionBurstServer::create(callback, requestChannel,
    //                                      resultChannel, this);
    //
    // However, this alternative representation does not include a memory map
    // caching optimization, and adds overhead.
    const std::shared_ptr<BurstExecutorWithCache> executorWithCache =
            std::make_shared<BurstExecutorWithCache>(mModel, mDriver, mPoolInfos);
    const sp<V1_2::IBurstContext> burst = ExecutionBurstServer::create(
            callback, requestChannel, resultChannel, executorWithCache);
    if (burst == nullptr) {
        cb(ErrorStatus::GENERAL_FAILURE, {});
    } else {
        cb(ErrorStatus::NONE, burst);
    }
    return Void();
}