सिस्टम स्वास्थ्य की निगरानी करें

वॉचडॉग विक्रेता सेवाओं और वीएचएएल सेवा के स्वास्थ्य की निगरानी करता है, और किसी भी अस्वास्थ्यकर प्रक्रिया को समाप्त कर देता है। जब एक अस्वस्थ प्रक्रिया समाप्त हो जाती है, तो वॉचडॉग अन्य एप्लिकेशन नॉट रिस्पॉन्डिंग (एएनआर) डंप की तरह प्रक्रिया स्थिति को /data/anr पर डंप कर देता है। ऐसा करने से डिबगिंग प्रक्रिया आसान हो जाती है।

विक्रेता सेवा स्वास्थ्य निगरानी

विक्रेता सेवाओं की निगरानी मूल और जावा दोनों तरफ से की जाती है। किसी विक्रेता सेवा की निगरानी के लिए, सेवा को पूर्व-निर्धारित टाइमआउट निर्दिष्ट करके वॉचडॉग के साथ एक स्वास्थ्य जांच प्रक्रिया पंजीकृत करनी होगी। वॉचडॉग पंजीकृत स्वास्थ्य जांच प्रक्रिया के स्वास्थ्य की निगरानी पंजीकरण के दौरान निर्दिष्ट समय-सीमा के सापेक्ष अंतराल पर पिंग करके करता है। जब पिंग की गई प्रक्रिया समय-सीमा के भीतर प्रतिक्रिया नहीं देती है, तो प्रक्रिया को अस्वस्थ माना जाता है।

मूल सेवा स्वास्थ्य निगरानी

वॉचडॉग एआईडीएल मेकफ़ाइल निर्दिष्ट करें

  1. shared_libs में carwatchdog_aidl_interface-ndk_platform शामिल करें।

    Android.bp

    cc_binary {
        name: "sample_native_client",
        srcs: [
            "src/*.cpp"
        ],
        shared_libs: [
            "carwatchdog_aidl_interface-ndk_platform",
            "libbinder_ndk",
        ],
        vendor: true,
    }
    

एक SELinux नीति जोड़ें

  1. SELinux नीति जोड़ने के लिए, विक्रेता सेवा डोमेन को बाइंडर ( binder_use मैक्रो) का उपयोग करने की अनुमति दें और विक्रेता सेवा डोमेन को carwatchdog क्लाइंट डोमेन ( carwatchdog_client_domain मैक्रो) में जोड़ें। sample_client.te और file_contexts के लिए नीचे दिया गया कोड देखें:

    sample_client.te

    type sample_client, domain;
    type sample_client_exec, exec_type, file_type, vendor_file_type;
    
    carwatchdog_client_domain(sample_client)
    
    init_daemon_domain(sample_client)
    binder_use(sample_client)
    

    file_contexts

    /vendor/bin/sample_native_client  u:object_r:sample_client_exec:s0
    

BnCarWatchDogClient को इनहेरिट करके क्लाइंट क्लास लागू करें

  1. checkIfAlive में, स्वास्थ्य जांच करें। एक विकल्प थ्रेड लूप हैंडलर पर पोस्ट करना है। यदि स्वस्थ हैं, तो ICarWatchdog::tellClientAlive पर कॉल करें। SampleNativeClient.h और SampleNativeClient.cpp के लिए नीचे दिया गया कोड देखें:

    SampleNativeClient.h

    class SampleNativeClient : public BnCarWatchdogClient {
    public:
        ndk::ScopedAStatus checkIfAlive(int32_t sessionId, TimeoutLength
            timeout) override;
        ndk::ScopedAStatus prepareProcessTermination() override;
        void initialize();
    
    private:
        void respondToDaemon();
    private:
        ::android::sp<::android::Looper> mHandlerLooper;
        std::shared_ptr<ICarWatchdog> mWatchdogServer;
        std::shared_ptr<ICarWatchdogClient> mClient;
        int32_t mSessionId;
    };
    

    SampleNativeClient.cpp

    ndk::ScopedAStatus WatchdogClient::checkIfAlive(int32_t sessionId, TimeoutLength timeout) {
        mHandlerLooper->removeMessages(mMessageHandler,
            WHAT_CHECK_ALIVE);
        mSessionId = sessionId;
        mHandlerLooper->sendMessage(mMessageHandler,
            Message(WHAT_CHECK_ALIVE));
        return ndk::ScopedAStatus::ok();
    }
    // WHAT_CHECK_ALIVE triggers respondToDaemon from thread handler
    void WatchdogClient::respondToDaemon() {
      // your health checking method here
      ndk::ScopedAStatus status = mWatchdogServer->tellClientAlive(mClient,
            mSessionId);
    }
    

बाइंडर थ्रेड प्रारंभ करें और क्लाइंट को पंजीकृत करें

कार वॉचडॉग डेमॉन इंटरफ़ेस का नाम android.automotive.watchdog.ICarWatchdog/default है।

  1. नाम के साथ डेमॉन खोजें और ICarWatchdog::registerClient कॉल करें। main.cpp और SampleNativeClient.cpp के लिए नीचे दिया गया कोड देखें:

    main.cpp

    int main(int argc, char** argv) {
        sp<Looper> looper(Looper::prepare(/*opts=*/0));
    
        ABinderProcess_setThreadPoolMaxThreadCount(1);
        ABinderProcess_startThreadPool();
        std::shared_ptr<SampleNativeClient> client =
            ndk::SharedRefBase::make<SampleNatvieClient>(looper);
    
        // The client is registered in initialize()
        client->initialize();
        ...
    }
    

    SampleNativeClient.cpp

    void SampleNativeClient::initialize() {
        ndk::SpAIBinder binder(AServiceManager_getService(
            "android.automotive.watchdog.ICarWatchdog/default"));
        std::shared_ptr<ICarWatchdog> server =
            ICarWatchdog::fromBinder(binder);
        mWatchdogServer = server;
        ndk::SpAIBinder binder = this->asBinder();
        std::shared_ptr<ICarWatchdogClient> client =
            ICarWatchdogClient::fromBinder(binder)
        mClient = client;
        server->registerClient(client, TimeoutLength::TIMEOUT_NORMAL);
    }
    

जावा सेवा स्वास्थ्य निगरानी

CarWatchDogClientCallback को इनहेरिट करके क्लाइंट को कार्यान्वित करें

  1. नई फ़ाइल को इस प्रकार संपादित करें:
    private final CarWatchdogClientCallback mClientCallback = new CarWatchdogClientCallback() {
        @Override
        public boolean onCheckHealthStatus(int sessionId, int timeout) {
            // Your health check logic here
            // Returning true implies the client is healthy
            // If false is returned, the client should call
            // CarWatchdogManager.tellClientAlive after health check is
            // completed
        }
    
        @Override
        public void onPrepareProcessTermination() {}
    };
    

ग्राहक को पंजीकृत करें

  1. CarWatchdogManager.registerClient() पर कॉल करें:
    private void startClient() {
        CarWatchdogManager manager =
            (CarWatchdogManager) car.getCarManager(
            Car.CAR_WATCHDOG_SERVICE);
        // Choose a proper executor according to your health check method
        ExecutorService executor = Executors.newFixedThreadPool(1);
        manager.registerClient(executor, mClientCallback,
            CarWatchdogManager.TIMEOUT_NORMAL);
    }
    

ग्राहक का पंजीकरण रद्द करें

  1. सेवा समाप्त होने पर CarWatchdogManager.unregisterClient() को कॉल करें:
    private void finishClient() {
        CarWatchdogManager manager =
            (CarWatchdogManager) car.getCarManager(
            Car.CAR_WATCHDOG_SERVICE);
        manager.unregisterClient(mClientCallback);
    }
    

वीएचएएल स्वास्थ्य निगरानी

विक्रेता सेवा स्वास्थ्य निगरानी के विपरीत, वॉचडॉग VHAL_HEARTBEAT वाहन संपत्ति की सदस्यता लेकर VHAL सेवा स्वास्थ्य की निगरानी करता है। वॉचडॉग को उम्मीद है कि इस संपत्ति का मूल्य हर एन सेकंड में एक बार अपडेट किया जाएगा। जब इस टाइमआउट के भीतर दिल की धड़कन अपडेट नहीं होती है, तो वॉचडॉग वीएचएएल सेवा को समाप्त कर देता है।

नोट: वॉचडॉग VHAL सेवा स्वास्थ्य की निगरानी तभी करता है जब VHAL_HEARTBEAT वाहन संपत्ति VHAL सेवा द्वारा समर्थित होती है।

VHAL आंतरिक कार्यान्वयन विक्रेता द्वारा भिन्न हो सकता है। संदर्भ के रूप में निम्नलिखित कोड नमूनों का उपयोग करें।

  1. VHAL_HEARTBEAT वाहन संपत्ति पंजीकृत करें।

    VHAL सेवा प्रारंभ करते समय, VHAL_HEARTBEAT वाहन संपत्ति पंजीकृत करें। नीचे दिए गए उदाहरण में, एक unordered_map , जो प्रॉपर्टी आईडी को कॉन्फ़िगरेशन में मैप करता है, का उपयोग सभी समर्थित कॉन्फ़िगरेशन को रखने के लिए किया जाता है। VHAL_HEARTBEAT के लिए कॉन्फ़िगरेशन को मानचित्र में जोड़ा गया है, ताकि जब VHAL_HEARTBEAT पूछताछ की जाए, तो संबंधित कॉन्फ़िगरेशन वापस आ जाए।

    void registerVhalHeartbeatProperty() {
            const VehiclePropConfig config = {
                    .prop = toInt(VehicleProperty::VHAL_HEARTBEAT),
                    .access = VehiclePropertyAccess::READ,
                    .changeMode = VehiclePropertyChangeMode::ON_CHANGE,
            };
           // mConfigsById is declared as std::unordered_map<int32_t, VehiclePropConfig>.
           mConfigsById[config.prop] = config;
    }
    
  2. VHAL_HEARTBEAT वाहन संपत्ति अपडेट करें।

    वीएचएएल स्वास्थ्य जांच आवृत्ति ( वीएचएएल स्वास्थ्य जांच की आवृत्ति परिभाषित करें" में समझाया गया है) के आधार पर, हर एन सेकंड में एक बार VHAL_HEARTBEAT वाहन संपत्ति को अपडेट करें। ऐसा करने का एक तरीका वीएचएएल स्वास्थ्य की जांच करने वाली कार्रवाई को कॉल करने के लिए RecurrentTimer का उपयोग करना है और टाइमआउट के भीतर VHAL_HEARTBEAT वाहन संपत्ति को अद्यतन करता है।

    नीचे RecurrentTimer का उपयोग करके एक नमूना कार्यान्वयन दिखाया गया है:

    int main(int argc, char** argv) {
            RecurrentTimer recurrentTimer(updateVhalHeartbeat);
            recurrentTimer.registerRecurrentEvent(kHeartBeatIntervalNs,
                                               static_cast<int32_t>(VehicleProperty::VHAL_HEARTBEAT));
            … Run service …
            recurrentTimer.unregisterRecurrentEvent(
                    static_cast<int32_t>(VehicleProperty::VHAL_HEARTBEAT));
    }
    
    void updateVhalHeartbeat(const std::vector<int32_t>& cookies) {
           for (int32_t property : cookies) {
                  if (property != static_cast<int32_t>(VehicleProperty::VHAL_HEARTBEAT)) {
                         continue;
                  }
    
                  // Perform internal health checking such as retrieving a vehicle property to ensure
                  // the service is responsive.
                  doHealthCheck();
    
                  // Construct the VHAL_HEARTBEAT property with system uptime.
                  VehiclePropValuePool valuePool;
                  VehicleHal::VehiclePropValuePtr propValuePtr = valuePool.obtainInt64(uptimeMillis());
                  propValuePtr->prop = static_cast<int32_t>(VehicleProperty::VHAL_HEARTBEAT);
                  propValuePtr->areaId = 0;
                  propValuePtr->status = VehiclePropertyStatus::AVAILABLE;
                  propValuePtr->timestamp = elapsedRealtimeNano();
    
                  // Propagate the HAL event.
                  onHalEvent(std::move(propValuePtr));
           }
    }
    
  3. ( वैकल्पिक ) वीएचएएल स्वास्थ्य जांच की आवृत्ति को परिभाषित करें।

    वॉचडॉग की ro.carwatchdog.vhal_healthcheck.interval रीड-ओनली उत्पाद संपत्ति VHAL स्वास्थ्य जांच आवृत्ति को परिभाषित करती है। डिफ़ॉल्ट स्वास्थ्य जाँच आवृत्ति (जब यह गुण परिभाषित नहीं है) तीन सेकंड है। यदि VHAL सेवा के लिए VHAL_HEARTBEAT वाहन संपत्ति को अद्यतन करने के लिए तीन सेकंड पर्याप्त नहीं हैं, तो सेवा प्रतिक्रिया के आधार पर VHAL स्वास्थ्य जांच आवृत्ति को परिभाषित करें।

वॉचडॉग द्वारा डिबग अस्वास्थ्यकर प्रक्रियाओं को समाप्त कर दिया गया

वॉचडॉग प्रक्रिया स्थिति को डंप कर देता है और अस्वास्थ्यकर प्रक्रियाओं को समाप्त कर देता है। किसी अस्वस्थ प्रक्रिया को समाप्त करते समय, वॉचडॉग टेक्स्ट carwatchdog terminated <process name> (pid:<process id>) को लॉगकैट में लॉग करता है। यह लॉग लाइन प्रक्रिया नाम और प्रक्रिया आईडी जैसी समाप्त प्रक्रिया के बारे में जानकारी प्रदान करती है।

  1. उपरोक्त पाठ के लिए लॉगकैट को चलाकर खोजा जा सकता है:
    $ adb logcat -s CarServiceHelper | fgrep "carwatchdog killed"
    

    उदाहरण के लिए, जब किचनसिंक ऐप एक पंजीकृत वॉचडॉग क्लाइंट है और वॉचडॉग पिंग के प्रति अनुत्तरदायी हो जाता है, तो पंजीकृत किचनसिंक प्रक्रिया को समाप्त करते समय वॉचडॉग नीचे दी गई लाइन जैसी एक लाइन लॉग करता है।

    05-01 09:50:19.683   578  5777 W CarServiceHelper: carwatchdog killed com.google.android.car.kitchensink (pid: 5574)
    
  2. अनुत्तरदायीता के मूल कारण की पहचान करने के लिए, /data/anr पर संग्रहीत प्रक्रिया डंप का उपयोग करें जैसे आप गतिविधि ANR मामलों के लिए उपयोग करेंगे। समाप्त प्रक्रिया के लिए डंप फ़ाइल को पुनः प्राप्त करने के लिए नीचे दिए गए आदेशों का उपयोग करें।
    $ adb root
    $ adb shell grep -Hn "pid process_pid" /data/anr/*
    

    निम्नलिखित नमूना आउटपुट किचनसिंक ऐप के लिए विशिष्ट है:

    $ adb shell su root grep -Hn "pid 5574" /data/anr/*.
    
    /data/anr/anr_2020-05-01-09-50-18-290:3:----- pid 5574 at 2020-05-01 09:50:18 -----
    /data/anr/anr_2020-05-01-09-50-18-290:285:----- Waiting Channels: pid 5574 at 2020-05-01 09:50:18 -----
    

    समाप्त किचनसिंक प्रक्रिया के लिए डंप फ़ाइल /data/anr/anr_2020-05-01-09-50-18-290 पर स्थित है। समाप्त प्रक्रिया की ANR डंप फ़ाइल का उपयोग करके अपना विश्लेषण प्रारंभ करें।