ESPHome: /opt/build/esphome/esphome/components/micro_wake_word/micro_wake_word.h Source File

 #pragma once

 #ifdef USE_ESP_IDF

 #include "preprocessor_settings.h"
 #include "streaming_model.h"

 #include "esphome/core/automation.h"
 #include "esphome/core/component.h"
 #include "esphome/core/ring_buffer.h"

 #include "esphome/components/microphone/microphone.h"

 #include <frontend_util.h>

 #include <tensorflow/lite/core/c/common.h>
 #include <tensorflow/lite/micro/micro_interpreter.h>
 #include <tensorflow/lite/micro/micro_mutable_op_resolver.h>

 namespace esphome {
 namespace micro_wake_word {

 enum State {
   IDLE,
   START_MICROPHONE,
   STARTING_MICROPHONE,
   DETECTING_WAKE_WORD,
   STOP_MICROPHONE,
   STOPPING_MICROPHONE,
 };

 // The number of audio slices to process before accepting a positive detection
 static const uint8_t MIN_SLICES_BEFORE_DETECTION = 74;

 class MicroWakeWord : public Component {
  public:
   void setup() override;
   void loop() override;
   float get_setup_priority() const override;
   void dump_config() override;

   void start();
   void stop();

   bool is_running() const { return this->state_ != State::IDLE; }

   void set_features_step_size(uint8_t step_size) { this->features_step_size_ = step_size; }

   void set_microphone(microphone::Microphone *microphone) { this->microphone_ = microphone; }

   Trigger<std::string> *get_wake_word_detected_trigger() const { return this->wake_word_detected_trigger_; }

   void add_wake_word_model(const uint8_t *model_start, float probability_cutoff, size_t sliding_window_average_size,
                            const std::string &wake_word, size_t tensor_arena_size);

 #ifdef USE_MICRO_WAKE_WORD_VAD
   void add_vad_model(const uint8_t *model_start, float probability_cutoff, size_t sliding_window_size,
                      size_t tensor_arena_size);
 #endif

  protected:
   microphone::Microphone *microphone_{nullptr};
   Trigger<std::string> *wake_word_detected_trigger_ = new Trigger<std::string>();
   State state_{State::IDLE};
   HighFrequencyLoopRequester high_freq_;

   std::unique_ptr<RingBuffer> ring_buffer_;

   std::vector<WakeWordModel> wake_word_models_;

 #ifdef USE_MICRO_WAKE_WORD_VAD
   std::unique_ptr<VADModel> vad_model_;
 #endif

   tflite::MicroMutableOpResolver<20> streaming_op_resolver_;

   // Audio frontend handles generating spectrogram features
   struct FrontendConfig frontend_config_;
   struct FrontendState frontend_state_;

   // When the wake word detection first starts, we ignore this many audio
   // feature slices before accepting a positive detection
   int16_t ignore_windows_{-MIN_SLICES_BEFORE_DETECTION};

   uint8_t features_step_size_;

   // Stores audio read from the microphone before being added to the ring buffer.
   int16_t *input_buffer_{nullptr};
   // Stores audio to be fed into the audio frontend for generating features.
   int16_t *preprocessor_audio_buffer_{nullptr};

   bool detected_{false};
   std::string detected_wake_word_{""};

   void set_state_(State state);

   bool has_enough_samples_();

   size_t read_microphone_();

   bool allocate_buffers_();

   void deallocate_buffers_();

   bool load_models_();

   void unload_models_();

   void update_model_probabilities_();

   bool detect_wake_words_();

   bool generate_features_for_window_(int8_t features[PREPROCESSOR_FEATURE_SIZE]);

   void reset_states_();

   bool register_streaming_ops_(tflite::MicroMutableOpResolver<20> &op_resolver);

   inline uint16_t new_samples_to_get_() { return (this->features_step_size_ * (AUDIO_SAMPLE_FREQUENCY / 1000)); }
 };

 template<typename... Ts> class StartAction : public Action<Ts...>, public Parented<MicroWakeWord> {
  public:
   void play(Ts... x) override { this->parent_->start(); }
 };

 template<typename... Ts> class StopAction : public Action<Ts...>, public Parented<MicroWakeWord> {
  public:
   void play(Ts... x) override { this->parent_->stop(); }
 };

 template<typename... Ts> class IsRunningCondition : public Condition<Ts...>, public Parented<MicroWakeWord> {
  public:
   bool check(Ts... x) override { return this->parent_->is_running(); }
 };

 }  // namespace micro_wake_word
 }  // namespace esphome

 #endif  // USE_ESP_IDF
state
bool state
Definition: fan.h:34

esphome::micro_wake_word::MicroWakeWord::stop
void stop()
Definition: micro_wake_word.cpp:181

esphome::micro_wake_word::MicroWakeWord::add_wake_word_model
void add_wake_word_model(const uint8_t *model_start, float probability_cutoff, size_t sliding_window_average_size, const std::string &wake_word, size_t tensor_arena_size)
Definition: micro_wake_word.cpp:88

esphome::micro_wake_word::MicroWakeWord::set_features_step_size
void set_features_step_size(uint8_t step_size)
Definition: micro_wake_word.h:47

esphome::micro_wake_word::MicroWakeWord::preprocessor_audio_buffer_
int16_t * preprocessor_audio_buffer_
Definition: micro_wake_word.h:90

esphome::micro_wake_word::MicroWakeWord::set_state_
void set_state_(State state)
Definition: micro_wake_word.cpp:193

esphome::micro_wake_word::MicroWakeWord::wake_word_detected_trigger_
Trigger< std::string > * wake_word_detected_trigger_
Definition: micro_wake_word.h:63

esphome::micro_wake_word::MicroWakeWord::detect_wake_words_
bool detect_wake_words_()
Checks every model&#39;s recent probabilities to determine if the wake word has been predicted.
Definition: micro_wake_word.cpp:312

x
uint16_t x
Definition: tt21100.cpp:17

esphome::micro_wake_word::MicroWakeWord::state_
State state_
Definition: micro_wake_word.h:64

esphome::micro_wake_word::MicroWakeWord::ring_buffer_
std::unique_ptr< RingBuffer > ring_buffer_
Definition: micro_wake_word.h:67

esphome::HighFrequencyLoopRequester
Helper class to request loop() to be called as fast as possible.
Definition: helpers.h:630

esphome::micro_wake_word::MicroWakeWord::detected_
bool detected_
Definition: micro_wake_word.h:92

esphome::micro_wake_word::STARTING_MICROPHONE
Definition: micro_wake_word.h:26

automation.h

esphome::micro_wake_word::MicroWakeWord::loop
void loop() override
Definition: micro_wake_word.cpp:102

esphome::micro_wake_word::StopAction
Definition: micro_wake_word.h:163

esphome::micro_wake_word::MicroWakeWord::get_setup_priority
float get_setup_priority() const override
Definition: micro_wake_word.cpp:29

esphome::micro_wake_word::STOP_MICROPHONE
Definition: micro_wake_word.h:28

esphome::Component
Definition: component.h:68

esphome::micro_wake_word::MicroWakeWord::high_freq_
HighFrequencyLoopRequester high_freq_
Definition: micro_wake_word.h:65

esphome::micro_wake_word::MicroWakeWord::ignore_windows_
int16_t ignore_windows_
Definition: micro_wake_word.h:83

esphome::micro_wake_word::MicroWakeWord::setup
void setup() override
Definition: micro_wake_word.cpp:61

esphome::micro_wake_word::MicroWakeWord::frontend_config_
struct FrontendConfig frontend_config_
Definition: micro_wake_word.h:78

esphome::micro_wake_word::MicroWakeWord::input_buffer_
int16_t * input_buffer_
Definition: micro_wake_word.h:88

esphome::microphone::Microphone
Definition: microphone.h:19

esphome::micro_wake_word::DETECTING_WAKE_WORD
Definition: micro_wake_word.h:27

esphome::micro_wake_word::STOPPING_MICROPHONE
Definition: micro_wake_word.h:29

ring_buffer.h

esphome::micro_wake_word::MicroWakeWord::wake_word_models_
std::vector< WakeWordModel > wake_word_models_
Definition: micro_wake_word.h:69

esphome::micro_wake_word::MicroWakeWord::update_model_probabilities_
void update_model_probabilities_()
Performs inference with each configured model.
Definition: micro_wake_word.cpp:293

esphome::micro_wake_word::MicroWakeWord::dump_config
void dump_config() override
Definition: micro_wake_word.cpp:50

esphome::micro_wake_word::IsRunningCondition::check
bool check(Ts... x) override
Definition: micro_wake_word.h:170

esphome::Action
Definition: automation.h:121

esphome::micro_wake_word::MicroWakeWord::register_streaming_ops_
bool register_streaming_ops_(tflite::MicroMutableOpResolver< 20 > &op_resolver)
Returns true if successfully registered the streaming model&#39;s TensorFlow operations.
Definition: micro_wake_word.cpp:410

esphome::micro_wake_word::START_MICROPHONE
Definition: micro_wake_word.h:25

esphome::micro_wake_word::MicroWakeWord::features_step_size_
uint8_t features_step_size_
Definition: micro_wake_word.h:85

esphome::micro_wake_word::MicroWakeWord::microphone_
microphone::Microphone * microphone_
Definition: micro_wake_word.h:62

esphome::Condition
Base class for all automation conditions.
Definition: automation.h:74

esphome::micro_wake_word::MicroWakeWord::allocate_buffers_
bool allocate_buffers_()
Allocates memory for input_buffer_, preprocessor_audio_buffer_, and ring_buffer_. ...
Definition: micro_wake_word.cpp:219

esphome::micro_wake_word::IDLE
Definition: micro_wake_word.h:24

esphome::micro_wake_word::MicroWakeWord::start
void start()
Definition: micro_wake_word.cpp:149

esphome::micro_wake_word::MicroWakeWord::has_enough_samples_
bool has_enough_samples_()
Tests if there are enough samples in the ring buffer to generate new features.
Definition: micro_wake_word.cpp:340

esphome::micro_wake_word::MicroWakeWord::streaming_op_resolver_
tflite::MicroMutableOpResolver< 20 > streaming_op_resolver_
Definition: micro_wake_word.h:75

esphome::micro_wake_word::MicroWakeWord::generate_features_for_window_
bool generate_features_for_window_(int8_t features[PREPROCESSOR_FEATURE_SIZE])
Generates features for a window of audio samples.
Definition: micro_wake_word.cpp:345

esphome::micro_wake_word::MicroWakeWord::deallocate_buffers_
void deallocate_buffers_()
Frees memory allocated for input_buffer_ and preprocessor_audio_buffer_.
Definition: micro_wake_word.cpp:249

esphome::micro_wake_word::StopAction::play
void play(Ts... x) override
Definition: micro_wake_word.h:165

esphome::micro_wake_word::IsRunningCondition
Definition: micro_wake_word.h:168

esphome::micro_wake_word::MicroWakeWord::new_samples_to_get_
uint16_t new_samples_to_get_()
Definition: micro_wake_word.h:155

esphome::micro_wake_word::MicroWakeWord::frontend_state_
struct FrontendState frontend_state_
Definition: micro_wake_word.h:79

esphome::micro_wake_word::MicroWakeWord::reset_states_
void reset_states_()
Resets the ring buffer, ignore_windows_, and sliding window probabilities.
Definition: micro_wake_word.cpp:398

esphome::micro_wake_word::StartAction
Definition: micro_wake_word.h:158

streaming_model.h

preprocessor_settings.h

esphome::micro_wake_word::State
State
Definition: micro_wake_word.h:23

esphome::micro_wake_word::MicroWakeWord::is_running
bool is_running() const
Definition: micro_wake_word.h:45

esphome::micro_wake_word::MicroWakeWord::get_wake_word_detected_trigger
Trigger< std::string > * get_wake_word_detected_trigger() const
Definition: micro_wake_word.h:51

esphome::micro_wake_word::MicroWakeWord
Definition: micro_wake_word.h:35

esphome
Implementation of SPI Controller mode.
Definition: a01nyub.cpp:7

esphome::Trigger< std::string >

esphome::micro_wake_word::StartAction::play
void play(Ts... x) override
Definition: micro_wake_word.h:160

esphome::micro_wake_word::MicroWakeWord::detected_wake_word_
std::string detected_wake_word_
Definition: micro_wake_word.h:93

component.h

microphone.h

esphome::micro_wake_word::MicroWakeWord::add_vad_model
void add_vad_model(const uint8_t *model_start, float probability_cutoff, size_t sliding_window_size, size_t tensor_arena_size)
Definition: micro_wake_word.cpp:96

esphome::micro_wake_word::MicroWakeWord::set_microphone
void set_microphone(microphone::Microphone *microphone)
Definition: micro_wake_word.h:49

esphome::micro_wake_word::MicroWakeWord::load_models_
bool load_models_()
Loads streaming models and prepares the feature generation frontend.
Definition: micro_wake_word.cpp:257

esphome::micro_wake_word::MicroWakeWord::vad_model_
std::unique_ptr< VADModel > vad_model_
Definition: micro_wake_word.h:72

esphome::Parented
Helper class to easily give an object a parent of type T.
Definition: helpers.h:538

esphome::micro_wake_word::MicroWakeWord::unload_models_
void unload_models_()
Deletes each model&#39;s TFLite interpreters and frees tensor arena memory.
Definition: micro_wake_word.cpp:282

esphome::micro_wake_word::MicroWakeWord::read_microphone_
size_t read_microphone_()
Reads audio from microphone into the ring buffer.
Definition: micro_wake_word.cpp:199