Sistem sağlığını izleme

Gözetmen, tedarikçi hizmetlerinin ve VHAL hizmetinin durumunu izler ve sağlıklı olmayan işlemleri sonlandırır. Sağlıklı olmayan bir işlem sonlandırıldığında Watchdog, diğer Uygulama Yanıt Vermiyor (ANR) dökümlerinde olduğu gibi işlem durumunu /data/anr olarak kaydeder. Bu sayede hata ayıklama işlemi kolaylaşır.

Tedarikçi firma hizmetinin sağlık durumunu izleme

Tedarikçi firma hizmetleri hem yerel hem de Java tarafında izlenir. Bir tedarikçi hizmetinin izlenmesi için hizmetin, önceden tanımlanmış bir zaman aşımı belirterek Watchdog'a bir sağlık kontrolü süreci kaydetmesi gerekir. Watchdog, kayıt sırasında belirtilen zaman aşımına göre belirli bir aralıkta ping göndererek kayıtlı bir durum denetimi sürecinin durumunu izler. Pinglenen bir işlem, zaman aşımı süresi içinde yanıt vermezse işlem iyi durumda kabul edilmez.

Yerleşik hizmet durumu izleme

Watchdog AIDL make dosyasını belirtin

  1. shared_libs adlı ülkede carwatchdog_aidl_interface-ndk_platform öğesini dahil edin.

    Android.bp

    cc_binary {
        name: "sample_native_client",
        srcs: [
            "src/*.cpp"
        ],
        shared_libs: [
            "carwatchdog_aidl_interface-ndk_platform",
            "libbinder_ndk",
        ],
        vendor: true,
    }

SELinux politikası ekleme

  1. SELinux politikası eklemek için tedarikçi firma hizmet alanının binder'ı (binder_use makrosu) kullanmasına izin verin ve tedarikçi firma hizmet alanını carwatchdog istemci alanına (carwatchdog_client_domain makrosu) ekleyin. sample_client.te ve file_contexts için aşağıdaki koda bakın:

    sample_client.te

    type sample_client, domain;
    type sample_client_exec, exec_type, file_type, vendor_file_type;
    
    carwatchdog_client_domain(sample_client)
    
    init_daemon_domain(sample_client)
    binder_use(sample_client)

    file_contexts

    /vendor/bin/sample_native_client  u:object_r:sample_client_exec:s0

BnCarWatchdogClient sınıfını devralarak bir istemci sınıfı uygulayın.

  1. checkIfAlive'te durum denetimi yapın. Bir seçenek, ileti dizisi döngüsü işleyicisine yayın göndermektir. Sağlıklıysa ICarWatchdog::tellClientAlive numaralı telefonu arayın. SampleNativeClient.h ve SampleNativeClient.cpp için aşağıdaki koda bakın:

    SampleNativeClient.h

    class SampleNativeClient : public BnCarWatchdogClient {
    public:
        ndk::ScopedAStatus checkIfAlive(int32_t sessionId, TimeoutLength
            timeout) override;
        ndk::ScopedAStatus prepareProcessTermination() override;
        void initialize();
    
    private:
        void respondToDaemon();
    private:
        ::android::sp<::android::Looper> mHandlerLooper;
        std::shared_ptr<ICarWatchdog> mWatchdogServer;
        std::shared_ptr<ICarWatchdogClient> mClient;
        int32_t mSessionId;
    };

    SampleNativeClient.cpp

    ndk::ScopedAStatus WatchdogClient::checkIfAlive(int32_t sessionId, TimeoutLength timeout) {
        mHandlerLooper->removeMessages(mMessageHandler,
            WHAT_CHECK_ALIVE);
        mSessionId = sessionId;
        mHandlerLooper->sendMessage(mMessageHandler,
            Message(WHAT_CHECK_ALIVE));
        return ndk::ScopedAStatus::ok();
    }
    // WHAT_CHECK_ALIVE triggers respondToDaemon from thread handler
    void WatchdogClient::respondToDaemon() {
      // your health checking method here
      ndk::ScopedAStatus status = mWatchdogServer->tellClientAlive(mClient,
            mSessionId);
    }

Bir bağlayıcı ileti dizisi başlatın ve istemciyi kaydedin

Araç güvenlik zamanlayıcısı arka plan programı arayüzünün adı android.automotive.watchdog.ICarWatchdog/default.

  1. Adına göre daemon'ı arayın ve ICarWatchdog::registerClient'ü çağırın. main.cpp ve SampleNativeClient.cpp için aşağıdaki koda bakın:

    main.cpp

    int main(int argc, char** argv) {
        sp<Looper> looper(Looper::prepare(/*opts=*/0));
    
        ABinderProcess_setThreadPoolMaxThreadCount(1);
        ABinderProcess_startThreadPool();
        std::shared_ptr<SampleNativeClient> client =
            ndk::SharedRefBase::make<SampleNatvieClient>(looper);
    
        // The client is registered in initialize()
        client->initialize();
        ...
    }

    SampleNativeClient.cpp

    void SampleNativeClient::initialize() {
        ndk::SpAIBinder binder(AServiceManager_getService(
            "android.automotive.watchdog.ICarWatchdog/default"));
        std::shared_ptr<ICarWatchdog> server =
            ICarWatchdog::fromBinder(binder);
        mWatchdogServer = server;
        ndk::SpAIBinder binder = this->asBinder();
        std::shared_ptr<ICarWatchdogClient> client =
            ICarWatchdogClient::fromBinder(binder)
        mClient = client;
        server->registerClient(client, TimeoutLength::TIMEOUT_NORMAL);
    }

Java hizmetinin sağlık durumunu izleme

CarWatchdogClientCallback sınıfını devralarak istemci uygulama

  1. Yeni dosyayı aşağıdaki gibi düzenleyin:
    private final CarWatchdogClientCallback mClientCallback = new CarWatchdogClientCallback() {
        @Override
        public boolean onCheckHealthStatus(int sessionId, int timeout) {
            // Your health check logic here
            // Returning true implies the client is healthy
            // If false is returned, the client should call
            // CarWatchdogManager.tellClientAlive after health check is
            // completed
        }
    
        @Override
        public void onPrepareProcessTermination() {}
    };

İstemciyi kaydetme

  1. CarWatchdogManager.registerClient() numaralı telefonu arayın:
    private void startClient() {
        CarWatchdogManager manager =
            (CarWatchdogManager) car.getCarManager(
            Car.CAR_WATCHDOG_SERVICE);
        // Choose a proper executor according to your health check method
        ExecutorService executor = Executors.newFixedThreadPool(1);
        manager.registerClient(executor, mClientCallback,
            CarWatchdogManager.TIMEOUT_NORMAL);
    }

İstemcinin kaydını iptal etme

  1. Hizmet tamamlandığında CarWatchdogManager.unregisterClient() numaralı telefonu arayın:
    private void finishClient() {
        CarWatchdogManager manager =
            (CarWatchdogManager) car.getCarManager(
            Car.CAR_WATCHDOG_SERVICE);
        manager.unregisterClient(mClientCallback);
    }

VHAL sağlık durumu izleme

Tedarikçi firma hizmet durumu izlemenin aksine Watchdog, VHAL_HEARTBEAT araç mülküne abone olarak VHAL hizmet durumunu izler. Gözetmen, bu özelliğin değerinin N saniyede bir güncellenmesini bekler. Kalp atışı bu zaman aşımı içinde güncellenmediğinde Watchdog, VHAL hizmetini sonlandırır.

Not: Gözetmen, VHAL hizmet durumunu yalnızca VHAL_HEARTBEAT araç mülkü VHAL hizmeti tarafından desteklendiğinde izler.

VHAL'ın dahili uygulaması tedarikçiye göre değişiklik gösterebilir. Referans olarak aşağıdaki kod örneklerini kullanın.

  1. VHAL_HEARTBEAT araç mülkünü kaydedin.

    VHAL hizmetini başlatırken VHAL_HEARTBEAT araç mülkünü kaydedin. Aşağıdaki örnekte, desteklenen tüm yapılandırmaları tutmak için mülk kimliğini yapılandırmaya eşleyen bir unordered_map kullanılır. VHAL_HEARTBEAT için yapılandırma dosyası haritaya eklenir. Böylece, VHAL_HEARTBEAT sorgulandığında ilgili yapılandırma dosyası döndürülür.

    void registerVhalHeartbeatProperty() {
            const VehiclePropConfig config = {
                    .prop = toInt(VehicleProperty::VHAL_HEARTBEAT),
                    .access = VehiclePropertyAccess::READ,
                    .changeMode = VehiclePropertyChangeMode::ON_CHANGE,
            };
           // mConfigsById is declared as std::unordered_map<int32_t, VehiclePropConfig>.
           mConfigsById[config.prop] = config;
    }
  2. VHAL_HEARTBEAT araç mülkünü güncelleyin.

    VHAL durum denetimi sıklığına göre (VHAL durum denetimi sıklığını tanımlama bölümünde açıklanmıştır) VHAL_HEARTBEAT araç mülkünü N saniyede bir güncelleyin. Bunu yapmanın bir yolu, VHAL durumunu kontrol eden ve zaman aşımı içinde VHAL_HEARTBEAT araç mülkünü güncelleyen işlemi çağırmak için RecurrentTimer değerini kullanmaktır.

    Aşağıda, RecurrentTimer kullanan örnek bir uygulama gösterilmektedir:

    int main(int argc, char** argv) {
            RecurrentTimer recurrentTimer(updateVhalHeartbeat);
            recurrentTimer.registerRecurrentEvent(kHeartBeatIntervalNs,
                                               static_cast<int32_t>(VehicleProperty::VHAL_HEARTBEAT));
             Run service 
            recurrentTimer.unregisterRecurrentEvent(
                    static_cast<int32_t>(VehicleProperty::VHAL_HEARTBEAT));
    }
    
    void updateVhalHeartbeat(const std::vector<int32_t>& cookies) {
           for (int32_t property : cookies) {
                  if (property != static_cast<int32_t>(VehicleProperty::VHAL_HEARTBEAT)) {
                         continue;
                  }
    
                  // Perform internal health checking such as retrieving a vehicle property to ensure
                  // the service is responsive.
                  doHealthCheck();
    
                  // Construct the VHAL_HEARTBEAT property with system uptime.
                  VehiclePropValuePool valuePool;
                  VehicleHal::VehiclePropValuePtr propValuePtr = valuePool.obtainInt64(uptimeMillis());
                  propValuePtr->prop = static_cast<int32_t>(VehicleProperty::VHAL_HEARTBEAT);
                  propValuePtr->areaId = 0;
                  propValuePtr->status = VehiclePropertyStatus::AVAILABLE;
                  propValuePtr->timestamp = elapsedRealtimeNano();
    
                  // Propagate the HAL event.
                  onHalEvent(std::move(propValuePtr));
           }
    }
  3. (İsteğe bağlı) VHAL durum denetiminin sıklığını tanımlayın.

    Watchdog'un ro.carwatchdog.vhal_healthcheck.interval salt okunur ürün özelliği, VHAL sağlık kontrolü sıklığını tanımlar. Varsayılan durum denetimi sıklığı (bu özellik tanımlanmadığında) üç saniyedir. VHAL hizmetinin VHAL_HEARTBEAT araç mülkünü güncellemesi için üç saniye yeterli değilse VHAL durum denetimi sıklığını, hizmetin yanıt vermesine bağlı olarak tanımlayın.

Watchdog tarafından sonlandırılan sağlıksız işlemlerin hata ayıklama

Watchdog, işlem durumunu dökümü alır ve sorunlu işlemleri sonlandırır. Watchdog, sağlıklı olmayan bir işlemi sonlandırırken carwatchdog terminated <process name> (pid:<process id>) metnini logcat'e kaydeder. Bu günlük satırı, sonlandırılan işlemle ilgili işlem adı ve işlem kimliği gibi bilgiler sağlar.

  1. Aşağıdaki komutu çalıştırarak logcat'te yukarıda belirtilen metin için arama yapabilirsiniz:
    $ adb logcat -s CarServiceHelper | fgrep "carwatchdog killed"

    Örneğin, KitchenSink uygulaması kayıtlı bir Watchdog istemcisi olduğunda ve Watchdog ping'lerine yanıt vermediğinde Watchdog, kayıtlı KitchenSink sürecini sonlandırırken aşağıdaki satıra benzer bir satır kaydeder.

    05-01 09:50:19.683   578  5777 W CarServiceHelper: carwatchdog killed com.google.android.car.kitchensink (pid: 5574)
  2. Yanıt vermeme sorununun temel nedenini belirlemek için /data/anr adresinde depolanan işlem dökümünü, etkinlik ANR durumları için kullanacağınız gibi kullanın. Sonlandırılan işlemin dökümü dosyasını almak için aşağıdaki komutları kullanın.
    $ adb root
    $ adb shell grep -Hn "pid process_pid" /data/anr/*

    Aşağıdaki örnek çıkış, KitchenSink uygulamasına özgüdür:

    $ adb shell su root grep -Hn "pid 5574" /data/anr/*.
    /data/anr/anr_2020-05-01-09-50-18-290:3:----- pid 5574 at 2020-05-01 09:50:18 -----
    /data/anr/anr_2020-05-01-09-50-18-290:285:----- Waiting Channels: pid 5574 at 2020-05-01 09:50:18 -----

    Sonlandırılan KitchenSink işleminin dökümü dosyası /data/anr/anr_2020-05-01-09-50-18-290 adresinde bulunmaktadır. Sonlandırılan işlemin ANR dökümü dosyasını kullanarak analizinizi başlatın.