25.3. Запросы к внешним файлам #
Чтобы выполнять запросы к файлам из озера данных (например, из локального или S3-хранилища), используйте функции read_*.
Чтобы получить доступ к столбцам, используйте синтаксис r['.имя_столбца']
Пример 25.3.
-- Выполнить запрос к одному Parquet-файлу
SELECT
r['product_id'],
r['review_text']
FROM
read_parquet('s3://my-bucket/reviews.parquet') r -- 'r' is a required alias
LIMIT 100;
-- Выполнить запрос к нескольким CSV-файлам, используя glob-шаблон
SELECT
r['timestamp'],
r['event_type'],
COUNT(*) as event_count
FROM
read_csv('s3://my-datalake/logs/2024-*.csv') r
GROUP BY
r['timestamp'],
r['event_type'];