Update

2025-01-15 10:35:58 +01:00 · 2025-01-15 10:35:58 +01:00 · c3c4dcd894
parent 36c08d3cc5
commit c3c4dcd894
57 changed files with 193 additions and 47 deletions
--- a/acceptance/bundle/init/default-python/output.txt
+++ b/acceptance/bundle/init/default-python/output.txt
@ -1,30 +0,0 @@
-
->>> $CLI bundle init default-python --config-file ./input.json --output-dir output
-
-Welcome to the default Python template for Databricks Asset Bundles!
-Workspace to use (auto-detected, edit in 'my_default_python/databricks.yml'): http://$DATABRICKS_HOST
-
-✨ Your new project has been created in the 'my_default_python' directory!
-
-Please refer to the README.md file for "getting started" instructions.
-See also the documentation at https://docs.databricks.com/dev-tools/bundles/index.html.
-
->>> $CLI bundle validate -t dev
-Name: my_default_python
-Target: dev
-Workspace:
-  Host: http://$DATABRICKS_HOST
-  User: $USERNAME
-  Path: /Workspace/Users/$USERNAME/.bundle/my_default_python/dev
-
-Validation OK!
-
->>> $CLI bundle validate -t prod
-Name: my_default_python
-Target: prod
-Workspace:
-  Host: http://$DATABRICKS_HOST
-  User: $USERNAME
-  Path: /Workspace/Users/$USERNAME/.bundle/my_default_python/prod
-
-Validation OK!
--- a/acceptance/bundle/templates/dbt-sql/input.json
+++ b/acceptance/bundle/templates/dbt-sql/input.json
--- a/acceptance/bundle/templates/dbt-sql/output.txt
+++ b/acceptance/bundle/templates/dbt-sql/output.txt
@ -30,3 +30,12 @@ Workspace:
  Path: /Workspace/Users/$USERNAME/.bundle/my_dbt_sql/prod

 Validation OK!
+
+>>> ruff format --diff
+warning: No Python files found under the given path(s)
+
+Exit code: 0
+
+>>> ruff clean
+
+Exit code: 0
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/.gitignore
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/.gitignore
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/.vscode/builtins.pyi
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/.vscode/builtins.pyi
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/.vscode/extensions.json
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/.vscode/extensions.json
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/.vscode/settings.json
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/.vscode/settings.json
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/README.md
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/README.md
@ -47,7 +47,7 @@ and deployment to production (using Databricks Asset Bundles).
   (see https://docs.databricks.com/dev-tools/auth/pat.html).
   You can use OAuth as an alternative, but this currently requires manual configuration.
   See https://github.com/databricks/dbt-databricks/blob/main/docs/oauth.md
-   for general instructions, or https://community.databricks.com/t5/technical-blog/using-dbt-core-with-oauth-on-azure-databricks/ba-p/46605
+   for general instructions, or https://community.databricks.com/t5/technical-blog/using-dbt-core-with-oauth-on-azure-databricks/ba-p/<NUMID>
   for advice on setting up OAuth for Azure Databricks.

   To setup up additional profiles, such as a 'prod' profile,
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/databricks.yml
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/databricks.yml
@ -3,7 +3,7 @@
 # See https://docs.databricks.com/dev-tools/bundles/index.html for documentation.
 bundle:
  name: my_dbt_sql
-  uuid: 9d4ad8f6-850c-45fb-b51a-04fa314564de
+  uuid: <UUID>

 include:
  - resources/*.yml
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/dbt_profiles/profiles.yml
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/dbt_profiles/profiles.yml
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/dbt_project.yml
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/dbt_project.yml
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/profile_template.yml
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/profile_template.yml
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/requirements-dev.txt
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/requirements-dev.txt
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/resources/my_dbt_sql.job.yml
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/resources/my_dbt_sql.job.yml
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/analyses/.gitkeep
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/analyses/.gitkeep
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/macros/.gitkeep
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/macros/.gitkeep
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/models/example/orders_daily.sql
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/models/example/orders_daily.sql
@ -2,7 +2,7 @@
 -- This model file defines a materialized view called 'orders_daily'
 --
 -- Read more about materialized at https://docs.getdbt.com/reference/resource-configs/databricks-configs#materialized-views-and-streaming-tables
-- Current limitation: a "full refresh" is needed in case the definition below is changed; see https://github.com/databricks/dbt-databricks/issues/561.
+-- Current limitation: a "full refresh" is needed in case the definition below is changed; see https://github.com/databricks/dbt-databricks/issues/<NUMID>.
 {{ config(materialized = 'materialized_view') }}

 select order_date, count(*) AS number_of_orders
@ -11,7 +11,7 @@ from {{ ref('orders_raw') }}

 -- During development, only process a smaller range of data
 {% if target.name != 'prod' %}
-where order_date >= '2019-08-01' and order_date < '2019-09-01'
+where order_date >= '<NUMID>-08-01' and order_date < '<NUMID>-09-01'
 {% endif %}

 group by order_date
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/models/example/orders_raw.sql
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/models/example/orders_raw.sql
@ -2,7 +2,7 @@
 --
 -- The streaming table below ingests all JSON files in /databricks-datasets/retail-org/sales_orders/
 -- Read more about streaming tables at https://docs.getdbt.com/reference/resource-configs/databricks-configs#materialized-views-and-streaming-tables
-- Current limitation: a "full refresh" is needed in case the definition below is changed; see https://github.com/databricks/dbt-databricks/issues/561.
+-- Current limitation: a "full refresh" is needed in case the definition below is changed; see https://github.com/databricks/dbt-databricks/issues/<NUMID>.
 {{ config(materialized = 'streaming_table') }}

 select
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/models/example/schema.yml
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/models/example/schema.yml
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/seeds/.gitkeep
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/seeds/.gitkeep
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/snapshots/.gitkeep
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/snapshots/.gitkeep
--- a/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/tests/.gitkeep
+++ b/acceptance/bundle/templates/dbt-sql/output/my_dbt_sql/src/tests/.gitkeep
--- a/acceptance/bundle/templates/dbt-sql/script
+++ b/acceptance/bundle/templates/dbt-sql/script
--- a/acceptance/bundle/templates/default-python/input.json
+++ b/acceptance/bundle/templates/default-python/input.json
--- a/acceptance/bundle/templates/default-python/output.txt
+++ b/acceptance/bundle/templates/default-python/output.txt
@ -0,0 +1,157 @@
+
+>>> $CLI bundle init default-python --config-file ./input.json --output-dir output
+
+Welcome to the default Python template for Databricks Asset Bundles!
+Workspace to use (auto-detected, edit in 'my_default_python/databricks.yml'): http://$DATABRICKS_HOST
+
+✨ Your new project has been created in the 'my_default_python' directory!
+
+Please refer to the README.md file for "getting started" instructions.
+See also the documentation at https://docs.databricks.com/dev-tools/bundles/index.html.
+
+>>> $CLI bundle validate -t dev
+Name: my_default_python
+Target: dev
+Workspace:
+  Host: http://$DATABRICKS_HOST
+  User: $USERNAME
+  Path: /Workspace/Users/$USERNAME/.bundle/my_default_python/dev
+
+Validation OK!
+
+>>> $CLI bundle validate -t prod
+Name: my_default_python
+Target: prod
+Workspace:
+  Host: http://$DATABRICKS_HOST
+  User: $USERNAME
+  Path: /Workspace/Users/$USERNAME/.bundle/my_default_python/prod
+
+Validation OK!
+
+>>> ruff format --diff
+--- scratch/exploration.ipynb:cell 1
+++ scratch/exploration.ipynb:cell 1
+--- scratch/exploration.ipynb:cell 2
+++ scratch/exploration.ipynb:cell 2
+@@ -1,5 +1,6 @@
+ import sys
+-sys.path.append('../src')
+
+sys.path.append("../src")
+ from my_default_python import main
+ 
+ main.get_taxis(spark).show(10)
+
+--- setup.py
+++ setup.py
+@@ -5,11 +5,13 @@
+ be executed directly. See README.md for how to deploy, test, and run
+ the my_default_python project.
+ """
+
+ from setuptools import setup, find_packages
+ 
+ import sys
+-sys.path.append('./src')
+ 
+sys.path.append("./src")
+
+ import datetime
+ import my_default_python
+ 
+@@ -17,17 +19,15 @@
+     name="my_default_python",
+     # We use timestamp as Local version identifier (https://peps.python.org/pep-<NUMID>/#local-version-identifiers.)
+     # to ensure that changes to wheel package are picked up when used on all-purpose clusters
+-    version=my_default_python.__version__ + "+" + datetime.datetime.utcnow().strftime("%Y%m%d.%H%M%S"),
+    version=my_default_python.__version__
+    + "+"
+    + datetime.datetime.utcnow().strftime("%Y%m%d.%H%M%S"),
+     url="https://databricks.com",
+     author="$USERNAME",
+     description="wheel file based on my_default_python/src",
+-    packages=find_packages(where='./src'),
+-    package_dir={'': 'src'},
+-    entry_points={
+-        "packages": [
+-            "main=my_default_python.main:main"
+-        ]
+-    },
+    packages=find_packages(where="./src"),
+    package_dir={"": "src"},
+    entry_points={"packages": ["main=my_default_python.main:main"]},
+     install_requires=[
+         # Dependencies in case the output wheel file is used as a library dependency.
+         # For defining dependencies, when this package is used in Databricks, see:
+
+--- src/dlt_pipeline.ipynb:cell 2
+++ src/dlt_pipeline.ipynb:cell 2
+@@ -1,6 +1,7 @@
+ # Import DLT and src/my_default_python
+ import dlt
+ import sys
+
+ sys.path.append(spark.conf.get("bundle.sourcePath", "."))
+ from pyspark.sql.functions import expr
+ from my_default_python import main
+--- src/dlt_pipeline.ipynb:cell 3
+++ src/dlt_pipeline.ipynb:cell 3
+@@ -1,7 +1,8 @@
+ @dlt.view
+ def taxi_raw():
+-  return main.get_taxis(spark)
+    return main.get_taxis(spark)
+
+ 
+ @dlt.table
+ def filtered_taxis():
+-  return dlt.read("taxi_raw").filter(expr("fare_amount < 30"))
+    return dlt.read("taxi_raw").filter(expr("fare_amount < 30"))
+
+--- src/my_default_python/main.py
+++ src/my_default_python/main.py
+@@ -1,21 +1,25 @@
+ from pyspark.sql import SparkSession, DataFrame
+ 
+
+ def get_taxis(spark: SparkSession) -> DataFrame:
+-  return spark.read.table("samples.nyctaxi.trips")
+    return spark.read.table("samples.nyctaxi.trips")
+ 
+ 
+ # Create a new Databricks Connect session. If this fails,
+ # check that you have configured Databricks Connect correctly.
+ # See https://docs.databricks.com/dev-tools/databricks-connect.html.
+ def get_spark() -> SparkSession:
+-  try:
+-    from databricks.connect import DatabricksSession
+-    return DatabricksSession.builder.getOrCreate()
+-  except ImportError:
+-    return SparkSession.builder.getOrCreate()
+    try:
+        from databricks.connect import DatabricksSession
+
+        return DatabricksSession.builder.getOrCreate()
+    except ImportError:
+        return SparkSession.builder.getOrCreate()
+
+ 
+ def main():
+-  get_taxis(get_spark()).show(5)
+    get_taxis(get_spark()).show(5)
+
+ 
+-if __name__ == '__main__':
+-  main()
+if __name__ == "__main__":
+    main()
+
+4 files would be reformatted, 3 files already formatted
+
+Exit code: 1
+
+>>> ruff clean
+Removing cache at: .ruff_cache
+
+Exit code: 0
--- a/acceptance/bundle/templates/default-python/output/my_default_python/.gitignore
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/.gitignore
--- a/acceptance/bundle/templates/default-python/output/my_default_python/.vscode/builtins.pyi
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/.vscode/builtins.pyi
--- a/acceptance/bundle/templates/default-python/output/my_default_python/.vscode/extensions.json
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/.vscode/extensions.json
--- a/acceptance/bundle/templates/default-python/output/my_default_python/.vscode/settings.json
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/.vscode/settings.json
--- a/acceptance/bundle/templates/default-python/output/my_default_python/README.md
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/README.md
--- a/acceptance/bundle/templates/default-python/output/my_default_python/databricks.yml
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/databricks.yml
@ -2,7 +2,7 @@
 # See https://docs.databricks.com/dev-tools/bundles/index.html for documentation.
 bundle:
  name: my_default_python
-  uuid: 3c5cdb6b-9e42-46f3-a33c-54769acda6bf
+  uuid: <UUID>

 include:
  - resources/*.yml
--- a/acceptance/bundle/templates/default-python/output/my_default_python/fixtures/.gitkeep
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/fixtures/.gitkeep
--- a/acceptance/bundle/templates/default-python/output/my_default_python/pytest.ini
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/pytest.ini
--- a/acceptance/bundle/templates/default-python/output/my_default_python/requirements-dev.txt
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/requirements-dev.txt
--- a/acceptance/bundle/templates/default-python/output/my_default_python/resources/my_default_python.job.yml
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/resources/my_default_python.job.yml
--- a/acceptance/bundle/templates/default-python/output/my_default_python/resources/my_default_python.pipeline.yml
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/resources/my_default_python.pipeline.yml
--- a/acceptance/bundle/templates/default-python/output/my_default_python/scratch/README.md
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/scratch/README.md
--- a/acceptance/bundle/templates/default-python/output/my_default_python/setup.py
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/setup.py
@ -15,7 +15,7 @@ import my_default_python

 setup(
    name="my_default_python",
-    # We use timestamp as Local version identifier (https://peps.python.org/pep-0440/#local-version-identifiers.)
+    # We use timestamp as Local version identifier (https://peps.python.org/pep-<NUMID>/#local-version-identifiers.)
    # to ensure that changes to wheel package are picked up when used on all-purpose clusters
    version=my_default_python.__version__ + "+" + datetime.datetime.utcnow().strftime("%Y%m%d.%H%M%S"),
    url="https://databricks.com",
--- a/acceptance/bundle/templates/default-python/output/my_default_python/src/dlt_pipeline.ipynb
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/src/dlt_pipeline.ipynb
@ -6,7 +6,7 @@
    "application/vnd.databricks.v1+cell": {
     "cellMetadata": {},
     "inputWidgets": {},
-     "nuid": "9a626959-61c8-4bba-84d2-2a4ecab1f7ec",
+     "nuid": "<UUID>",
     "showTitle": false,
     "title": ""
    }
@ -24,7 +24,7 @@
    "application/vnd.databricks.v1+cell": {
     "cellMetadata": {},
     "inputWidgets": {},
-     "nuid": "9198e987-5606-403d-9f6d-8f14e6a4017f",
+     "nuid": "<UUID>",
     "showTitle": false,
     "title": ""
    }
@ -46,7 +46,7 @@
    "application/vnd.databricks.v1+cell": {
     "cellMetadata": {},
     "inputWidgets": {},
-     "nuid": "3fc19dba-61fd-4a89-8f8c-24fee63bfb14",
+     "nuid": "<UUID>",
     "showTitle": false,
     "title": ""
    }
--- a/acceptance/bundle/templates/default-python/output/my_default_python/src/my_default_python/init.py
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/src/my_default_python/init.py
--- a/acceptance/bundle/templates/default-python/output/my_default_python/src/my_default_python/main.py
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/src/my_default_python/main.py
--- a/acceptance/bundle/templates/default-python/output/my_default_python/src/notebook.ipynb
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/src/notebook.ipynb
@ -6,7 +6,7 @@
    "application/vnd.databricks.v1+cell": {
     "cellMetadata": {},
     "inputWidgets": {},
-     "nuid": "ee353e42-ff58-4955-9608-12865bd0950e",
+     "nuid": "<UUID>",
     "showTitle": false,
     "title": ""
    }
@ -33,11 +33,11 @@
   "metadata": {
    "application/vnd.databricks.v1+cell": {
     "cellMetadata": {
-      "byteLimit": 2048000,
-      "rowLimit": 10000
+      "byteLimit": <NUMID>,
+      "rowLimit": <NUMID>
     },
     "inputWidgets": {},
-     "nuid": "6bca260b-13d1-448f-8082-30b60a85c9ae",
+     "nuid": "<UUID>",
     "showTitle": false,
     "title": ""
    }
--- a/acceptance/bundle/templates/default-python/output/my_default_python/tests/main_test.py
+++ b/acceptance/bundle/templates/default-python/output/my_default_python/tests/main_test.py
--- a/acceptance/bundle/templates/default-python/script
+++ b/acceptance/bundle/templates/default-python/script
--- a/acceptance/bundle/templates/default-sql/input.json
+++ b/acceptance/bundle/templates/default-sql/input.json
--- a/acceptance/bundle/templates/default-sql/output.txt
+++ b/acceptance/bundle/templates/default-sql/output.txt
@ -30,3 +30,13 @@ Workspace:
  Path: /Workspace/Users/$USERNAME/.bundle/my_default_sql/prod

 Validation OK!
+
+>>> ruff format --diff
+error: Failed to parse scratch/exploration.ipynb:1:2:15: Simple statements must be separated by newlines or semicolons
+
+Exit code: 2
+
+>>> ruff clean
+Removing cache at: .ruff_cache
+
+Exit code: 0
--- a/acceptance/bundle/templates/default-sql/output/my_default_sql/.gitignore
+++ b/acceptance/bundle/templates/default-sql/output/my_default_sql/.gitignore
--- a/acceptance/bundle/templates/default-sql/output/my_default_sql/.vscode/extensions.json
+++ b/acceptance/bundle/templates/default-sql/output/my_default_sql/.vscode/extensions.json
--- a/acceptance/bundle/templates/default-sql/output/my_default_sql/.vscode/settings.json
+++ b/acceptance/bundle/templates/default-sql/output/my_default_sql/.vscode/settings.json
--- a/acceptance/bundle/templates/default-sql/output/my_default_sql/README.md
+++ b/acceptance/bundle/templates/default-sql/output/my_default_sql/README.md
--- a/acceptance/bundle/templates/default-sql/output/my_default_sql/databricks.yml
+++ b/acceptance/bundle/templates/default-sql/output/my_default_sql/databricks.yml
@ -2,7 +2,7 @@
 # See https://docs.databricks.com/dev-tools/bundles/index.html for documentation.
 bundle:
  name: my_default_sql
-  uuid: 631398bf-1d77-42ce-ba4f-9bb29dd64b5a
+  uuid: <UUID>

 include:
  - resources/*.yml
--- a/acceptance/bundle/templates/default-sql/output/my_default_sql/resources/my_default_sql_sql.job.yml
+++ b/acceptance/bundle/templates/default-sql/output/my_default_sql/resources/my_default_sql_sql.job.yml
--- a/acceptance/bundle/templates/default-sql/output/my_default_sql/scratch/README.md
+++ b/acceptance/bundle/templates/default-sql/output/my_default_sql/scratch/README.md
--- a/acceptance/bundle/templates/default-sql/output/my_default_sql/scratch/exploration.ipynb
+++ b/acceptance/bundle/templates/default-sql/output/my_default_sql/scratch/exploration.ipynb
@ -7,7 +7,7 @@
    "application/vnd.databricks.v1+cell": {
     "cellMetadata": {},
     "inputWidgets": {},
-     "nuid": "dc8c630c-1ea0-42e4-873f-e4dec4d3d416",
+     "nuid": "<UUID>",
     "showTitle": false,
     "title": ""
    }
--- a/acceptance/bundle/templates/default-sql/output/my_default_sql/src/orders_daily.sql
+++ b/acceptance/bundle/templates/default-sql/output/my_default_sql/src/orders_daily.sql
@ -15,7 +15,7 @@ WHERE if(
  true,

  -- During development, only process a smaller range of data
-  order_date >= '2019-08-01' AND order_date < '2019-09-01'
+  order_date >= '<NUMID>-08-01' AND order_date < '<NUMID>-09-01'
 )

 GROUP BY order_date
--- a/acceptance/bundle/templates/default-sql/output/my_default_sql/src/orders_raw.sql
+++ b/acceptance/bundle/templates/default-sql/output/my_default_sql/src/orders_raw.sql
--- a/acceptance/bundle/templates/default-sql/script
+++ b/acceptance/bundle/templates/default-sql/script