자동차 워치독

자동차 워치독을 사용하여 VHAL을 디버그하도록 지원합니다. 자동차 워치독은 비정상 프로세스의 상태를 모니터링하고 종료합니다. 자동차 워치독에서 프로세스를 모니터링하려면 프로세스가 자동차 워치독에 등록되어야 합니다. 자동차 워치독이 비정상 프로세스를 종료하면 자동차 워치독은 다른 ANR(애플리케이션 응답 없음) 덤프와 마찬가지로 프로세스 상태를 data/anr에 기록합니다. 이렇게 하면 디버깅 프로세스가 용이해집니다.

이 문서에서는 공급업체 HAL 및 서비스가 자동차 워치독으로 프로세스를 등록하는 방법을 설명합니다.

공급업체 HAL

일반적으로 공급업체 HAL은 hwbinder의 스레드 풀을 사용합니다. 그러나 자동차 워치독 클라이언트는 hwbinder와 다른 binder를 통해 자동차 워치독 데몬과 통신합니다. 따라서 binder의 다른 스레드 풀이 사용 중입니다.

Makefile에서 자동차 워치독 AIDL 지정

  1. shared_libscarwatchdog_aidl_interface-ndk_platform 포함:

    Android.bp로 정렬할 수 있습니다.

    cc_defaults {
        name: "vhal_v2_0_defaults",
        shared_libs: [
            "libbinder_ndk",
            "libhidlbase",
            "liblog",
            "libutils",
            "android.hardware.automotive.vehicle@2.0",
            "carwatchdog_aidl_interface-ndk_platform",
        ],
        cflags: [
            "-Wall",
            "-Wextra",
            "-Werror",
        ],
    }
    

SELinux 정책 추가

  1. system_server에서 HAL을 종료하도록 허용합니다. system_server.te가 없으면 새로 만듭니다. 각 기기에 SELinux 정책을 추가하는 것이 좋습니다.
  2. 공급업체 HAL에서 바인더(binder_use 매크로)를 사용하고 공급업체 HAL을 carwatchdog 클라이언트 도메인(carwatchdog_client_domain 매크로)에 추가하도록 허용합니다. systemserver.tevehicle_default.te의 경우 아래 코드를 참조하세요.

    system_server.te

    # Allow system_server to kill vehicle HAL
    allow system_server hal_vehicle_server:process sigkill;
    

    hal_vehicle_default.te

    # Configuration for register VHAL to car watchdog
    carwatchdog_client_domain(hal_vehicle_default)
    binder_use(hal_vehicle_default)
    

BnCarWatchdogClient를 상속하여 클라이언트 클래스 구현

  1. checkIfAlive에서 상태 확인을 실행합니다. 예를 들어 스레드 루프 핸들러에 게시합니다. 정상인 경우 ICarWatchdog::tellClientAlive를 호출합니다. WatchogClient.hWatchogClient.cpp의 경우 아래 코드를 참조하세요.

    WatchogClient.h

    class WatchdogClient : public aidl::android::automotive::watchdog::BnCarWatchdogClient {
      public:
        explicit WatchdogClient(const ::android::sp<::android::Looper>& handlerLooper, VehicleHalManager* vhalManager);
    
    ndk::ScopedAStatus checkIfAlive(int32_t sessionId, aidl::android::automotive::watchdog::TimeoutLength timeout) override; ndk::ScopedAStatus prepareProcessTermination() override; };

    WatchogClient.cpp

    ndk::ScopedAStatus WatchdogClient::checkIfAlive(int32_t sessionId, TimeoutLength /*timeout*/) {
        // Implement or call your health check logic here
        return ndk::ScopedAStatus::ok();
    }
    

바인더 스레드 시작 및 클라이언트 등록

  1. 바인더 통신을 위한 스레드 풀을 만듭니다. 공급업체 HAL이 자체 목적으로 hwbinder를 사용하는 경우 자동차 워치독 바인더 통신을 위한 다른 스레드 풀을 만들어야 합니다.
  2. 이름으로 데몬을 검색하고 ICarWatchdog::registerClient를 호출합니다. 자동차 워치독 데몬 인터페이스 이름은 android.automotive.watchdog.ICarWatchdog/default입니다.
  3. 서비스 응답성에 따라 자동차 워치독이 지원하는 다음 3가지 유형의 제한 시간 중 하나를 선택한 다음, ICarWatchdog::registerClient 호출 시 제한 시간을 전달합니다.
    • 심각(3초)
    • 보통(5초)
    • 정상(10초)
    VehicleService.cppWatchogClient.cpp의 경우 아래 코드를 참조하세요.

    VehicleService.cpp

    int main(int /* argc */, char* /* argv */ []) {
        // Set up thread pool for hwbinder
        configureRpcThreadpool(4, false /* callerWillJoin */);
    
        ALOGI("Registering as service...");
        status_t status = service->registerAsService();
    
        if (status != OK) {
            ALOGE("Unable to register vehicle service (%d)", status);
            return 1;
        }
    
        // Setup a binder thread pool to be a car watchdog client.
        ABinderProcess_setThreadPoolMaxThreadCount(1);
        ABinderProcess_startThreadPool();
        sp<Looper> looper(Looper::prepare(0 /* opts */));
        std::shared_ptr<WatchdogClient> watchdogClient =
                ndk::SharedRefBase::make<WatchdogClient>(looper, service.get());
        // The current health check is done in the main thread, so it falls short of capturing the real
        // situation. Checking through HAL binder thread should be considered.
        if (!watchdogClient->initialize()) {
            ALOGE("Failed to initialize car watchdog client");
            return 1;
        }
        ALOGI("Ready");
        while (true) {
            looper->pollAll(-1 /* timeoutMillis */);
        }
    
        return 1;
    }
    

    WatchogClient.cpp

    bool WatchdogClient::initialize() {
        ndk::SpAIBinder binder(AServiceManager_getService("android.automotive.watchdog.ICarWatchdog/default"));
        if (binder.get() == nullptr) {
            ALOGE("Failed to get carwatchdog daemon");
            return false;
        }
        std::shared_ptr<ICarWatchdog> server = ICarWatchdog::fromBinder(binder);
        if (server == nullptr) {
            ALOGE("Failed to connect to carwatchdog daemon");
            return false;
        }
        mWatchdogServer = server;
    
        binder = this->asBinder();
        if (binder.get() == nullptr) {
            ALOGE("Failed to get car watchdog client binder object");
            return false;
        }
        std::shared_ptr<ICarWatchdogClient> client = ICarWatchdogClient::fromBinder(binder);
        if (client == nullptr) {
            ALOGE("Failed to get ICarWatchdogClient from binder");
            return false;
        }
        mTestClient = client;
        mWatchdogServer->registerClient(client, TimeoutLength::TIMEOUT_NORMAL);
        ALOGI("Successfully registered the client to car watchdog server");
        return true;
    }
    

공급업체 서비스(네이티브)

자동차 워치독 AIDL makefile 지정

  1. shared_libscarwatchdog_aidl_interface-ndk_platform을 포함합니다.

    Android.bp

    cc_binary {
        name: "sample_native_client",
        srcs: [
            "src/*.cpp"
        ],
        shared_libs: [
            "carwatchdog_aidl_interface-ndk_platform",
            "libbinder_ndk",
        ],
        vendor: true,
    }
    

SELinux 정책 추가

  1. SELinux 정책을 추가하려면 공급업체 서비스 도메인에서 바인더(binder_use 매크로)를 사용하고 공급업체 서비스 도메인을 carwatchdog 클라이언트 도메인(carwatchdog_client_domain 매크로)에 추가하도록 허용합니다. sample_client.tefile_contexts의 경우 아래 코드를 참고하세요.

    sample_client.te

    type sample_client, domain;
    type sample_client_exec, exec_type, file_type, vendor_file_type;
    
    carwatchdog_client_domain(sample_client)
    
    init_daemon_domain(sample_client)
    binder_use(sample_client)
    

    file_contexts

    /vendor/bin/sample_native_client  u:object_r:sample_client_exec:s0
    

BnCarWatchdogClient를 상속하여 클라이언트 클래스 구현

  1. checkIfAlive에서 상태 확인을 실행합니다. 한 가지 옵션은 스레드 루프 핸들러에 게시하는 것입니다. 정상인 경우 ICarWatchdog::tellClientAlive를 호출합니다. SampleNativeClient.hSampleNativeClient.cpp의 경우 아래 코드를 참조하세요.

    SampleNativeClient.h

    class SampleNativeClient : public BnCarWatchdogClient {
    public:
        ndk::ScopedAStatus checkIfAlive(int32_t sessionId, TimeoutLength
            timeout) override;
        ndk::ScopedAStatus prepareProcessTermination() override;
        void initialize();
    
    private:
        void respondToDaemon();
    private:
        ::android::sp<::android::Looper> mHandlerLooper;
        std::shared_ptr<ICarWatchdog> mWatchdogServer;
        std::shared_ptr<ICarWatchdogClient> mClient;
        int32_t mSessionId;
    };
    

    SampleNativeClient.cpp

    ndk::ScopedAStatus WatchdogClient::checkIfAlive(int32_t sessionId, TimeoutLength timeout) {
        mHandlerLooper->removeMessages(mMessageHandler,
            WHAT_CHECK_ALIVE);
        mSessionId = sessionId;
        mHandlerLooper->sendMessage(mMessageHandler,
            Message(WHAT_CHECK_ALIVE));
        return ndk::ScopedAStatus::ok();
    }
    // WHAT_CHECK_ALIVE triggers respondToDaemon from thread handler
    void WatchdogClient::respondToDaemon() {
      // your health checking method here
      ndk::ScopedAStatus status = mWatchdogServer->tellClientAlive(mClient,
            mSessionId);
    }
    

바인더 스레드 시작 및 클라이언트 등록

자동차 워치독 데몬 인터페이스 이름은 android.automotive.watchdog.ICarWatchdog/default입니다.

  1. 이름으로 데몬을 검색하고 ICarWatchdog::registerClient를 호출합니다. main.cppSampleNativeClient.cpp의 경우 아래 코드를 참조하세요.

    main.cpp

    int main(int argc, char** argv) {
        sp<Looper> looper(Looper::prepare(/*opts=*/0));
    
        ABinderProcess_setThreadPoolMaxThreadCount(1);
        ABinderProcess_startThreadPool();
        std::shared_ptr<SampleNativeClient> client =
            ndk::SharedRefBase::make<SampleNatvieClient>(looper);
    
        // The client is registered in initialize()
        client->initialize();
        ...
    }
    

    SampleNativeClient.cpp

    void SampleNativeClient::initialize() {
        ndk::SpAIBinder binder(AServiceManager_getService(
            "android.automotive.watchdog.ICarWatchdog/default"));
        std::shared_ptr<ICarWatchdog> server =
            ICarWatchdog::fromBinder(binder);
        mWatchdogServer = server;
        ndk::SpAIBinder binder = this->asBinder();
        std::shared_ptr<ICarWatchdogClient> client =
            ICarWatchdogClient::fromBinder(binder)
        mClient = client;
        server->registerClient(client, TimeoutLength::TIMEOUT_NORMAL);
    }
    

공급업체 서비스(Android)

CarWatchdogClientCallback을 상속하여 클라이언트 구현

  1. 다음과 같이 새 파일을 수정합니다.
    private final CarWatchdogClientCallback mClientCallback = new CarWatchdogClientCallback() {
        @Override
        public boolean onCheckHealthStatus(int sessionId, int timeout) {
            // Your health check logic here
            // Returning true implies the client is healthy
            // If false is returned, the client should call
            // CarWatchdogManager.tellClientAlive after health check is
            // completed
        }
    
        @Override
        public void onPrepareProcessTermination() {}
    };
    

클라이언트 등록

  1. CarWatchdogManager.registerClient() 호출:
    private void startClient() {
        CarWatchdogManager manager =
            (CarWatchdogManager) car.getCarManager(
            Car.CAR_WATCHDOG_SERVICE);
        // Choose a proper executor according to your health check method
        ExecutorService executor = Executors.newFixedThreadPool(1);
        manager.registerClient(executor, mClientCallback,
            CarWatchdogManager.TIMEOUT_NORMAL);
    }
    

클라이언트 등록 취소

  1. 서비스가 완료되면 CarWatchdogManager.unregisterClient()를 호출합니다.
    private void finishClient() {
        CarWatchdogManager manager =
            (CarWatchdogManager) car.getCarManager(
            Car.CAR_WATCHDOG_SERVICE);
        manager.unregisterClient(mClientCallback);
    }
    

자동차 워치독이 종료하는 프로세스를 감지합니다.

자동차 워치독은 자동차 워치독에 등록된 프로세스가 중단되고 응답하지 않을 때 이 프로세스(공급업체 HAL, 공급업체 네이티브 서비스, 공급업체 Android 서비스)를 덤프/종료합니다. 이런 덤프는 logcat을 확인하여 감지합니다. 문제가 있는 프로세스가 덤프되거나 종료될 때 자동차 워치독은 carwatchdog killed process_name (pid:process_id) 로그를 출력합니다. 다음과 같습니다.

$ adb logcat -s CarServiceHelper | fgrep "carwatchdog killed"

관련 로그가 캡처됩니다. 예를 들어 KitchinSink 앱(자동차 워치독 클라이언트)이 중단된 경우 다음과 같은 줄이 로그에 기록됩니다.

05-01 09:50:19.683   578  5777 W CarServiceHelper: carwatchdog killed com.google.android.car.kitchensink (pid: 5574)

KitchinSink 앱이 중단되는 이유나 위치를 확인하려면 활동 ANR 사례를 사용하는 것처럼 /data/anr에 저장된 프로세스 덤프를 사용합니다.

$ adb root
$ adb shell grep -Hn "pid process_pid" /data/anr/*

KitchinSink 앱에 관련된 샘플 출력은 다음과 같습니다.

$ adb shell su root grep -Hn "pid 5574" /data/anr/*.
/data/anr/anr_2020-05-01-09-50-18-290:3:----- pid 5574 at 2020-05-01 09:50:18 -----
/data/anr/anr_2020-05-01-09-50-18-290:285:----- Waiting Channels: pid 5574 at 2020-05-01 09:50:18 -----

덤프 파일을 찾고(예: 위 예시의 /data/anr/anr_2020-05-01-09-50-18-290) 분석을 시작합니다.