Sistem sağlığını izleme

Watchdog, tedarikçi hizmetlerinin ve VHAL hizmetinin durumunu izler ve sağlıksız işlemleri sonlandırır. Sağlıksız bir işlem sonlandırıldığında Watchdog, diğer Uygulama Yanıt Vermiyor (ANR) dökümlerinde olduğu gibi işlem durumunu /data/anr konumuna boşaltır. Bu sayede hata ayıklama süreci kolaylaşır.

Tedarikçi hizmeti durumu izleme

Sağlayıcı hizmetleri hem yerel hem de Java tarafında izlenir. Bir tedarikçi hizmetinin izlenebilmesi için hizmetin, önceden tanımlanmış bir zaman aşımı belirterek Watchdog'a bir sağlık kontrolü süreci kaydetmesi gerekir. Watchdog, kayıt sırasında belirtilen zaman aşımına göre bir aralıkta ping göndererek kayıtlı bir durum denetimi sürecinin durumunu izler. Ping işlemi yapılan bir süreç zaman aşımı süresi içinde yanıt vermezse süreç iyi durumda değil olarak kabul edilir.

Yerel hizmet durumu izleme

Watchdog AIDL makefile'ını belirtin

  1. shared_libs içinde carwatchdog_aidl_interface-ndk_platform öğesini dahil edin.

    Android.bp

    cc_binary {
        name: "sample_native_client",
        srcs: [
            "src/*.cpp"
        ],
        shared_libs: [
            "carwatchdog_aidl_interface-ndk_platform",
            "libbinder_ndk",
        ],
        vendor: true,
    }

SELinux politikası ekleme

  1. SELinux politikası eklemek için tedarikçi hizmet alanının bağlayıcı kullanmasına izin verin (binder_use makrosu) ve tedarikçi hizmet alanını carwatchdog istemci alanına (carwatchdog_client_domain makrosu) ekleyin. sample_client.te ve file_contexts için aşağıdaki koda bakın:

    sample_client.te

    type sample_client, domain;
    type sample_client_exec, exec_type, file_type, vendor_file_type;
    
    carwatchdog_client_domain(sample_client)
    
    init_daemon_domain(sample_client)
    binder_use(sample_client)

    file_contexts

    /vendor/bin/sample_native_client  u:object_r:sample_client_exec:s0

BnCarWatchdogClient'ı devralarak bir istemci sınıfı uygulayın.

  1. checkIfAlive bölümünde durum denetimi yapın. Seçeneklerden biri, ileti dizisi döngüsü işleyicisine yayın göndermektir. Sağlıklıysa ICarWatchdog::tellClientAlive adlı kişiyi arayın. SampleNativeClient.h ve SampleNativeClient.cpp için aşağıdaki koda bakın:

    SampleNativeClient.h

    class SampleNativeClient : public BnCarWatchdogClient {
    public:
        ndk::ScopedAStatus checkIfAlive(int32_t sessionId, TimeoutLength
            timeout) override;
        ndk::ScopedAStatus prepareProcessTermination() override;
        void initialize();
    
    private:
        void respondToDaemon();
    private:
        ::android::sp<::android::Looper> mHandlerLooper;
        std::shared_ptr<ICarWatchdog> mWatchdogServer;
        std::shared_ptr<ICarWatchdogClient> mClient;
        int32_t mSessionId;
    };

    SampleNativeClient.cpp

    ndk::ScopedAStatus WatchdogClient::checkIfAlive(int32_t sessionId, TimeoutLength timeout) {
        mHandlerLooper->removeMessages(mMessageHandler,
            WHAT_CHECK_ALIVE);
        mSessionId = sessionId;
        mHandlerLooper->sendMessage(mMessageHandler,
            Message(WHAT_CHECK_ALIVE));
        return ndk::ScopedAStatus::ok();
    }
    // WHAT_CHECK_ALIVE triggers respondToDaemon from thread handler
    void WatchdogClient::respondToDaemon() {
      // your health checking method here
      ndk::ScopedAStatus status = mWatchdogServer->tellClientAlive(mClient,
            mSessionId);
    }

Bağlayıcı ileti dizisi başlatma ve istemciyi kaydetme

Araç güvenlik zamanlayıcısı arka plan programı arayüzünün adı android.automotive.watchdog.ICarWatchdog/default.

  1. Adı kullanarak arka plan programını arayın ve ICarWatchdog::registerClient işlevini çağırın. main.cpp ve SampleNativeClient.cpp için aşağıdaki koda bakın:

    main.cpp

    int main(int argc, char** argv) {
        sp<Looper> looper(Looper::prepare(/*opts=*/0));
    
        ABinderProcess_setThreadPoolMaxThreadCount(1);
        ABinderProcess_startThreadPool();
        std::shared_ptr<SampleNativeClient> client =
            ndk::SharedRefBase::make<SampleNatvieClient>(looper);
    
        // The client is registered in initialize()
        client->initialize();
        ...
    }

    SampleNativeClient.cpp

    void SampleNativeClient::initialize() {
        ndk::SpAIBinder binder(AServiceManager_getService(
            "android.automotive.watchdog.ICarWatchdog/default"));
        std::shared_ptr<ICarWatchdog> server =
            ICarWatchdog::fromBinder(binder);
        mWatchdogServer = server;
        ndk::SpAIBinder binder = this->asBinder();
        std::shared_ptr<ICarWatchdogClient> client =
            ICarWatchdogClient::fromBinder(binder)
        mClient = client;
        server->registerClient(client, TimeoutLength::TIMEOUT_NORMAL);
    }

Java hizmeti durumu izleme

CarWatchdogClientCallback'i devralarak bir istemci uygulama

  1. Yeni dosyayı aşağıdaki şekilde düzenleyin:
    private final CarWatchdogClientCallback mClientCallback = new CarWatchdogClientCallback() {
        @Override
        public boolean onCheckHealthStatus(int sessionId, int timeout) {
            // Your health check logic here
            // Returning true implies the client is healthy
            // If false is returned, the client should call
            // CarWatchdogManager.tellClientAlive after health check is
            // completed
        }
    
        @Override
        public void onPrepareProcessTermination() {}
    };

İstemciyi kaydetme

  1. CarWatchdogManager.registerClient() numaralı telefonu arayın:
    private void startClient() {
        CarWatchdogManager manager =
            (CarWatchdogManager) car.getCarManager(
            Car.CAR_WATCHDOG_SERVICE);
        // Choose a proper executor according to your health check method
        ExecutorService executor = Executors.newFixedThreadPool(1);
        manager.registerClient(executor, mClientCallback,
            CarWatchdogManager.TIMEOUT_NORMAL);
    }

İstemcinin kaydını silme

  1. Hizmet tamamlandığında CarWatchdogManager.unregisterClient() numaralı telefonu arayın:
    private void finishClient() {
        CarWatchdogManager manager =
            (CarWatchdogManager) car.getCarManager(
            Car.CAR_WATCHDOG_SERVICE);
        manager.unregisterClient(mClientCallback);
    }

VHAL durumunu izleme

Watchdog, tedarikçi hizmet durumu izleme özelliğinden farklı olarak VHAL_HEARTBEAT araç özelliğine abone olarak VHAL hizmet durumunu izler. Watchdog, bu özelliğin değerinin N saniyede bir güncellenmesini bekler. Kalp atışı bu zaman aşımı süresi içinde güncellenmezse Watchdog, VHAL hizmetini sonlandırır.

Not: Watchdog, VHAL hizmet durumunu yalnızca VHAL_HEARTBEAT araç özelliği VHAL hizmeti tarafından desteklendiğinde izler.

VHAL'nin dahili uygulaması tedarikçiye göre değişebilir. Referans olarak aşağıdaki kod örneklerini kullanın.

  1. VHAL_HEARTBEAT araç özelliğini kaydedin.

    VHAL hizmetini başlatırken VHAL_HEARTBEAT araç özelliğini kaydedin. Aşağıdaki örnekte, mülk kimliğini yapılandırmaya eşleyen bir unordered_map, desteklenen tüm yapılandırmaları tutmak için kullanılır. VHAL_HEARTBEAT için yapılandırma dosyası haritaya eklenir. Böylece, VHAL_HEARTBEAT sorgulandığında ilgili yapılandırma dosyası döndürülür.

    void registerVhalHeartbeatProperty() {
            const VehiclePropConfig config = {
                    .prop = toInt(VehicleProperty::VHAL_HEARTBEAT),
                    .access = VehiclePropertyAccess::READ,
                    .changeMode = VehiclePropertyChangeMode::ON_CHANGE,
            };
           // mConfigsById is declared as std::unordered_map<int32_t, VehiclePropConfig>.
           mConfigsById[config.prop] = config;
    }
  2. VHAL_HEARTBEAT araç özelliğini güncelleyin.

    VHAL durum denetimi sıklığına (VHAL durum denetimi sıklığını tanımlama bölümünde açıklanmıştır) göre VHAL_HEARTBEAT araç özelliğini N saniyede bir güncelleyin. Bunu yapmanın bir yolu, VHAL durumunu kontrol eden ve zaman aşımı içinde VHAL_HEARTBEAT araç özelliğini güncelleyen işlemi çağırmak için RecurrentTimer kullanmaktır.

    Aşağıda RecurrentTimer kullanılarak yapılan örnek bir uygulama gösterilmektedir:

    int main(int argc, char** argv) {
            RecurrentTimer recurrentTimer(updateVhalHeartbeat);
            recurrentTimer.registerRecurrentEvent(kHeartBeatIntervalNs,
                                               static_cast<int32_t>(VehicleProperty::VHAL_HEARTBEAT));
             Run service 
            recurrentTimer.unregisterRecurrentEvent(
                    static_cast<int32_t>(VehicleProperty::VHAL_HEARTBEAT));
    }
    
    void updateVhalHeartbeat(const std::vector<int32_t>& cookies) {
           for (int32_t property : cookies) {
                  if (property != static_cast<int32_t>(VehicleProperty::VHAL_HEARTBEAT)) {
                         continue;
                  }
    
                  // Perform internal health checking such as retrieving a vehicle property to ensure
                  // the service is responsive.
                  doHealthCheck();
    
                  // Construct the VHAL_HEARTBEAT property with system uptime.
                  VehiclePropValuePool valuePool;
                  VehicleHal::VehiclePropValuePtr propValuePtr = valuePool.obtainInt64(uptimeMillis());
                  propValuePtr->prop = static_cast<int32_t>(VehicleProperty::VHAL_HEARTBEAT);
                  propValuePtr->areaId = 0;
                  propValuePtr->status = VehiclePropertyStatus::AVAILABLE;
                  propValuePtr->timestamp = elapsedRealtimeNano();
    
                  // Propagate the HAL event.
                  onHalEvent(std::move(propValuePtr));
           }
    }
  3. (İsteğe bağlı) VHAL durum denetiminin sıklığını tanımlayın.

    Watchdog'un ro.carwatchdog.vhal_healthcheck.interval salt okunur ürün özelliği, VHAL durum denetimi sıklığını tanımlar. Varsayılan durum denetimi sıklığı (bu özellik tanımlanmadığında) üç saniyedir. VHAL hizmetinin VHAL_HEARTBEAT araç özelliğini güncellemesi için üç saniye yeterli değilse hizmetin yanıt verme hızına bağlı olarak VHAL durum denetimi sıklığını tanımlayın.

Watchdog tarafından sonlandırılan kötü durumdaki işlemlerde hata ayıklama

Watchdog, işlem durumunu boşaltır ve sağlıksız işlemleri sonlandırır. Watchdog, sağlıksız bir işlemi sonlandırırken logcat'e carwatchdog terminated <process name> (pid:<process id>) metnini kaydeder. Bu günlük satırı, sonlandırılan işlemle ilgili bilgileri (ör. işlem adı ve işlem kimliği) sağlar.

  1. Logcat'te yukarıda belirtilen metin için şu komut çalıştırılarak arama yapılabilir:
    $ adb logcat -s CarServiceHelper | fgrep "carwatchdog killed"

    Örneğin, KitchenSink uygulaması kayıtlı bir Watchdog istemcisi olduğunda ve Watchdog ping'lerine yanıt vermediğinde, Watchdog kayıtlı KitchenSink sürecini sonlandırırken aşağıdaki gibi bir satır kaydeder.

    05-01 09:50:19.683   578  5777 W CarServiceHelper: carwatchdog killed com.google.android.car.kitchensink (pid: 5574)
  2. Yanıt vermeme durumunun temel nedenini belirlemek için /data/anr konumunda depolanan işlem dökümünü, etkinlik ANR'si durumlarında olduğu gibi kullanın. Sonlandırılan işleme ait döküm dosyasını almak için aşağıdaki komutları kullanın.
    $ adb root
    $ adb shell grep -Hn "pid process_pid" /data/anr/*

    Aşağıdaki örnek çıkış, KitchenSink uygulamasına özeldir:

    $ adb shell su root grep -Hn "pid 5574" /data/anr/*.
    /data/anr/anr_2020-05-01-09-50-18-290:3:----- pid 5574 at 2020-05-01 09:50:18 -----
    /data/anr/anr_2020-05-01-09-50-18-290:285:----- Waiting Channels: pid 5574 at 2020-05-01 09:50:18 -----

    Sonlandırılan KitchenSink işlemi için döküm dosyası şu konumda bulunuyor: /data/anr/anr_2020-05-01-09-50-18-290. Analizinizi, sonlandırılan sürecin ANR döküm dosyasını kullanarak başlatın.