ابزار ساخت داده
انتشار اولیه | ۳ دسامبر ۲۰۲۱ |
---|---|
انتشار پایدار | 1.6.5
/ ۲ اکتبر ۲۰۲۳[۱] |
مخزن | |
نوشتهشده با | پایتون |
سیستمعامل | ویندوز, مکاواس, لینوکس |
در دسترس به | پایتون |
نوع | تحلیل داده، مدیریت داده |
مجوز | مجوز آپاچی 2 |
وبگاه |
ابزار ساخت داده[الف] یا دیبیتی (اختصاری dbt) یک ابزار خط فرمان منبع باز است که به تحلیلگران داده و مهندسان کمک میکند تا محتویات انبار داده خود را بهطور موثرتر تغییر دهند.[۲]
تاریخ
[ویرایش]شرکت آر جی متریکس[ب] در سال ۲۰۱۶ در مسیر یافتن راهکاری برای افزودن قابلیت تبدیل ابتدایی به سیستم استیچ[پ] (که توسط شرکت تلند[ت] در سال ۲۰۱۸ خریداری شد) به این محصول رسید.[۳] اولین نسخههای dbt به تحلیلگران داده اجازه میداد در فرایند تبدیل دادهها، با استفاده از بهترین شیوههای مهندسی نرمافزار، مشارکت داشته باشند.[۴]
dbt از ابتدا متن باز بود.[۵] ولی در سال ۲۰۱۸، تیم آزمایشگاه Labs[ث] (که در آن زمان فیشتاون آنالیتیکس[ج] نامیده میشد) یک محصول تجاری را بر روی dbt Core منتشر کرد.[۶]
منابع مالی
[ویرایش]آزمایشگاه dbt در آوریل ۲۰۲۰ محصول جدید خود با نام سری A خود را به رهبری شرکت آندریسن هوروویتز معرفی کرد.[۷] در نوامبر همان سال، آزمایشگاه dbt سری B خود را به رهبری آندریسن هوروویتز و سکویا معرفی کرد.[۸] و در ژوئن ۲۰۲۱، سری C خود را به رهبری آلتیمیتر[چ]، سکویا[ح] و آندریسن هوروویتز معرفی کرد.[۹] در فوریه ۲۰۲۲، این شرکت ۲۲۲ میلیون دلار برای سری D خود با ارزش ۴٫۲ میلیارد دلار جمعآوری کرد[۱۰]
بررسی اجمالی
[ویرایش]dbt مهندسان تحلیلگر را قادر میسازد تا با نوشتن عبارتهای انتخاب، دادهها را در انبارهای خود تبدیل کرده و نهایتاً آنها را به جداول و نمودار تبدیل کنند. dbt عمل تبدیل (T) را در فرآیندهای استخراج، بارگذاری، تبدیل [خ](اختصاری ELT) انجام میدهد - دادهها را استخراج یا بارگذاری نمیکند، اما به گونهای طراحی شده است که در تبدیل دادههایی که قبلاً در یک انبار قرار دارند، کارایی داشته باشد. هدف dbt این است که، مطابق با دیدگاه dbt، به تحلیلگران اجازه دهد بیشتر شبیه به مهندسان نرمافزار کار کنند.[۱۱]
dbt از فایلهای YAML برای تعریف ویژگیها استفاده میکند. seed
نوعی جدول مرجع است که در dbt برای دادههای ثابت یا به ندرت متغیر استفاده میشود (مانند کد کشورها یا جداول جستجو)، که مبتنی بر CSV هستند و معمولاً در یک پوشه seeds ذخیره میشوند.
یادداشتها
[ویرایش]- ↑ data build tool (dbt)
- ↑ RJMetrics
- ↑ Stitch
- ↑ Talend
- ↑ dbt Labs
- ↑ Fishtown Analytics
- ↑ Altimeter Capital
- ↑ Sequoia
- ↑ Extract, Load, transform (ELT)
منابع
[ویرایش]- ↑ "Release dbt-core v1.6.5 · dbt-labs/dbt-core". GitHub. Retrieved 10 Oct 2023.
- ↑ Atwal, Harvinder (9 December 2019). Practical DataOps: Delivering Agile Data Science at Scale (به انگلیسی). Apress. p. 223. ISBN 978-1-4842-5104-1.
- ↑ "Stitch is joining Talend". Stitch Data. 2018-11-07. Archived from the original on 2021-11-07. Retrieved 2021-11-07.
- ↑ "Goodbye RJMetrics, Hello Fishtown Analytics". dbt Blog. 2016-08-01. Archived from the original on 2021-11-07. Retrieved 2021-11-07.
- ↑ Cai, Kenrick. "Dbt Labs In Talks To Raise At $6 Billion Valuation, Six Months After Becoming A Unicorn". Forbes (به انگلیسی). Retrieved 2023-04-01.
- ↑ "Sinter Release Notes, August 2018: pull request builder, fine-grained GitHub permissions, and more". 2018-07-31. Archived from the original on 2021-11-07. Retrieved 2021-11-07.
- ↑ "Fishtown Analytics raises $12.9M Series A for its open-source analytics engineering tool". TechCrunch. 2020-04-22. Archived from the original on 2021-11-07. Retrieved 2021-11-07.
- ↑ "Fishtown Analytics raises $29.5M Series B for its data engineering platform". TechCrunch. 2020-11-11. Archived from the original on 2021-11-07. Retrieved 2021-11-07.
- ↑ "Of the Community, By the Community, For the Community". dbt Blog. 2021-06-30. Archived from the original on 2021-11-07. Retrieved 2021-11-07.
- ↑ Cai, Kenrick (24 Feb 2022). "VENTURE CAPITAL Dbt Labs Raises At $4.2 Billion Valuation, $2 Billion Less Than First Planned". Forbes (به انگلیسی). Forbes. Archived from the original on 11 May 2022. Retrieved 11 May 2022.
The Philadelphia-based data analytics startup revealed Thursday that it had settled on a $4.2 billion valuation as part of a $222 million Series D funding round
- ↑ "dbt viewpoint". Archived from the original on 2021-11-07. Retrieved 2021-11-07.