Интеграция ClickHouse с Kafka с использованием именованных коллекций

Введение

В этом руководстве мы рассмотрим, как подключить ClickHouse к Kafka с использованием именованных коллекций. Использование файла конфигурации для именованных коллекций предлагает несколько преимуществ:

Централизованное и упрощенное управление настройками конфигурации.
Изменения настроек могут быть внесены без изменения определений SQL-таблиц.
Упрощенный обзор и устранение неполадок в конфигурациях за счёт проверки единого файла конфигурации.

Это руководство было протестировано на Apache Kafka 3.4.1 и ClickHouse 24.5.1.

Предположения

В данном документе предполагается, что у вас есть:

Рабочий кластер Kafka.
Настроенный и работающий кластер ClickHouse.
Базовые знания SQL и ознакомленность с конфигурациями ClickHouse и Kafka.

Предварительные условия

Убедитесь, что пользователь, создающий именованную коллекцию, имеет необходимые права доступа:

Обратитесь к Руководству по управлению пользователями для получения дополнительной информации о включении контроля доступа.

Конфигурация

Добавьте следующий раздел в файл config.xml вашего ClickHouse:

Заметки по конфигурации

Отрегулируйте адреса Kafka и связанные настройки, чтобы они соответствовали вашей настройке кластера Kafka.
Раздел перед <kafka> содержит параметры движка Kafka для ClickHouse. Для полного списка параметров обратитесь к параметрам движка Kafka.
Раздел внутри <kafka> содержит расширенные параметры конфигурации Kafka. Для получения дополнительной информации обратитесь к конфигурации librdkafka.
В этом примере используется протокол безопасности SASL_SSL и механизм PLAIN. Настройте эти параметры в зависимости от конфигурации вашего кластера Kafka.

Создание таблиц и баз данных

Создайте необходимые базы данных и таблицы в вашем кластере ClickHouse. Если вы запускаете ClickHouse как одиночный узел, опустите кластерную часть SQL-команды и используйте любой другой движок вместо ReplicatedMergeTree.

Создание базы данных

Создание таблиц Kafka

Создайте первую таблицу Kafka для первого кластера Kafka:

Создайте вторую таблицу Kafka для второго кластера Kafka:

Создание реплицируемых таблиц

Создайте таблицу для первой таблицы Kafka:

Создайте таблицу для второй таблицы Kafka:

Создание материализованных представлений

Создайте материализованное представление для вставки данных из первой таблицы Kafka в первую реплицируемую таблицу:

Создайте материализованное представление для вставки данных из второй таблицы Kafka во вторую реплицируемую таблицу:

Проверка установки

Теперь вы должны видеть соответствующие группы потребителей на ваших кластерах Kafka:

cluster_1_clickhouse_consumer на cluster_1
cluster_2_clickhouse_consumer на cluster_2

Запустите следующие запросы на любом из узлов ClickHouse, чтобы увидеть данные в обеих таблицах:

Примечание

В этом руководстве данные, поступающие в обе темы Kafka, одинаковы. В вашем случае они могут отличаться. Вы можете добавить столько кластеров Kafka, сколько захотите.

Пример вывода:

Это завершает настройку интеграции ClickHouse с Kafka с использованием именованных коллекций. Централизовав конфигурации Kafka в файле config.xml ClickHouse, вы можете легче управлять и настраивать параметры, обеспечивая упрощенную и эффективную интеграцию.

Введение​

Предположения​

Предварительные условия​

Конфигурация​

Заметки по конфигурации​

Создание таблиц и баз данных​

Создание базы данных​

Создание таблиц Kafka​

Создание реплицируемых таблиц​

Создание материализованных представлений​

Проверка установки​

Примечание​