Přeskočit na obsah
_CORE
AI & Agentic Systems Core Informační Systémy Cloud & Platform Engineering Data Platforma & Integrace Security & Compliance QA, Testing & Observability IoT, Automatizace & Robotika Mobile & Digital Banky & Finance Pojišťovnictví Veřejná správa Obrana & Bezpečnost Zdravotnictví Energetika & Utility Telco & Média Průmysl & Výroba Logistika & E-commerce Retail & Loyalty
Reference Technologie Blog Knowledge Base O nás Spolupráce Kariéra
Pojďme to probrat

DuckDB — analytická databáze přímo ve vašem notebooku

01. 01. 2024 1 min čtení intermediate

DuckDB je SQLite pro analytiku — embedded sloupcová databáze bez serveru. Gigabajty dat rychlostí konkurující Sparku.

DuckDB — analytika bez infrastruktury

In-process OLAP bez serveru — běží ve vaší aplikaci.

import duckdb

result = duckdb.sql("""
    SELECT region, COUNT(*) AS orders, SUM(total_czk) AS revenue
    FROM 'data/orders/*.parquet'
    WHERE order_date >= '2026-01-01'
    GROUP BY region ORDER BY revenue DESC
""").fetchdf()

# Různé formáty bez importu
duckdb.sql("SELECT * FROM 'data.csv' LIMIT 10")
duckdb.sql("SELECT * FROM 's3://bucket/*.parquet'")

Kdy použít DuckDB

  • Lokální analýza — ad-hoc dotazy
  • Prototypování — testování SQL
  • CI/CD — testování dbt lokálně
  • Data science — SQL v Jupyter

Shrnutí

DuckDB je revoluční pro lokální analytiku. Zero setup, SQL nad soubory, integrace s pandas.

duckdbolapembeddedanalytics