Начало работы с Потоками данных HAQM Kinesis
Начало работы
Потоки данных HAQM Kinesis – это широко масштабируемый сервис по сбору и обработке данных с высокой степенью надежности, оптимизированный для работы с потоковыми данными. В соответствии с настройками в поток данных HAQM Kinesis могут непрерывно поступать данные из сотен тысяч источников. Данные становятся доступными для приложений HAQM Kinesis уже через миллисекунды, а записи данных попадают в эти приложения в порядке создания.
Потоки данных HAQM Kinesis можно интегрировать со многими сервисами AWS, включая: Данные HAQM Kinesis Firehose для преобразования данных в режиме, близком к реальному времени, и доставки потоковых данных в озеро данных AWS, например HAQM S3; Управляемый сервис HAQM для Apache Flink для управляемой обработки потоковых данных; AWS Lambda для обработки событий или записей; AWS PrivateLink для частных подключений; HAQM Cloudwatch для обработки метрик и журналов; а также AWS KMS для шифрования на стороне сервера.
Сервис «Потоки данных HAQM Kinesis» используется в качестве шлюза в системе обработки больших данных. Данные из различных источников помещаются в поток HAQM Kinesis, после чего могут использоваться различными приложениями HAQM Kinesis. В этом примере одно приложение (обозначено желтым) обрабатывает потоковые данные в режиме реального времени. Другое приложение (обозначено красным) выполняет простую агрегацию данных и отправляет обработанные данные в HAQM S3. Данные в S3 подвергаются обработке и сохраняются в HAQM Redshift для комплексного анализа. Третье приложение (обозначено зеленым) передает необработанные данные в HAQM S3, после чего они архивируются и отправляются в HAQM Glacier для экономичного долгосрочного хранения. Обратите внимание: все три конвейера обработки данных работают одновременно и параллельно.
Начать работу с HAQM Kinesis Data Streams
Видео
Использование Kinesis Data Streams
Зарегистрировавшись в HAQM Web Services, можно начать работу с HAQM Kinesis Data Streams. Для этого нужно выполнить следующие действия.
- Создать поток данных HAQM Kinesis с помощью консоли управления HAQM Kinesis или API CreateStream HAQM Kinesis.
- Настроить источники данных для непрерывной передачи данных в поток HAQM Kinesis.
- Создать приложения HAQM Kinesis для считывания и обработки данных из потока данных HAQM Kinesis.
Избранные решения
Решение для потоковой обработки данных AWS для HAQM Kinesis предоставляет шаблоны AWS CloudFormation, в которых данные проходят через источники, потоковое хранилище, потребителей и пункты назначения. Чтобы соответствовать разным примерам использования и потребностям бизнеса, решение предлагает четыре шаблона AWS CloudFormation. Настройки шаблонов позволяют применять лучшие рекомендации по защите данных и по мониторингу функциональности с помощью панелей и тревог.