25.3. Запросы к внешним файлам #

Чтобы выполнять запросы к файлам из озера данных (например, из локального или S3-хранилища), используйте функции read_*.

Чтобы получить доступ к столбцам, используйте синтаксис r['имя_столбца'].

Пример 25.3.

-- Выполнить запрос к одному Parquet-файлу
SELECT
  r['product_id'],
  r['review_text']
FROM
  read_parquet('s3://my-bucket/reviews.parquet') r -- 'r' is a required alias
LIMIT 100;

-- Выполнить запрос к нескольким CSV-файлам, используя glob-шаблон
SELECT
  r['timestamp'],
  r['event_type'],
  COUNT(*) as event_count
FROM
  read_csv('s3://my-datalake/logs/2024-*.csv') r
GROUP BY
  r['timestamp'],
  r['event_type'];