diff --git a/main.ipynb b/main.ipynb new file mode 100644 index 00000000..86456ff7 --- /dev/null +++ b/main.ipynb @@ -0,0 +1,2191 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "..." + ] + }, + { + "cell_type": "code", + "execution_count": 21, + "metadata": {}, + "outputs": [], + "source": [ + "import pandas as pd" + ] + }, + { + "cell_type": "code", + "execution_count": 22, + "metadata": {}, + "outputs": [], + "source": [ + "pd.options.display.float_format = '{:.2f}'.format" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "..." + ] + }, + { + "cell_type": "code", + "execution_count": 23, + "metadata": {}, + "outputs": [ + { + "name": "stderr", + "output_type": "stream", + "text": [ + "C:\\Users\\micha\\AppData\\Local\\Temp\\ipykernel_26160\\3760256257.py:1: DtypeWarning: Columns (25) have mixed types. Specify dtype option on import or set low_memory=False.\n", + " df_dofinansowanie = pd.read_csv(\n" + ] + } + ], + "source": [ + "df_dofinansowanie = pd.read_csv(\n", + " 'umowy_pelna_lista_krajowe.csv',\n", + " encoding='ISO-8859-2',\n", + " converters={'TERYT pe?ny': str},\n", + " thousands=',')\n", + "\n", + "df_dofinansowanie = df_dofinansowanie.loc[df_dofinansowanie['TERYT pe?ny'] != ''].reset_index(drop=True)\n", + "\n", + "df_dofinansowanie['Dofinansowanie UE (PLN)'] = \\\n", + " df_dofinansowanie['Dofinansowanie UE (PLN)'].apply(pd.to_numeric)\n", + "\n", + "df_dofinansowanie['Data rozpocz?cia realizacji'] = pd.to_datetime(df_dofinansowanie['Data rozpocz?cia realizacji'])\n", + "df_dofinansowanie['Rok rozpocz?cia realizacji'] = df_dofinansowanie['Data rozpocz?cia realizacji'].dt.year\n", + "\n", + "df_dofinansowanie['Data podpisania umowy pierwotnej'] = pd.to_datetime(df_dofinansowanie['Data podpisania umowy pierwotnej'])\n", + "df_dofinansowanie['Rok podpisania umowy pierwotnej'] = df_dofinansowanie['Data podpisania umowy pierwotnej'].dt.year" + ] + }, + { + "cell_type": "code", + "execution_count": 24, + "metadata": {}, + "outputs": [], + "source": [ + "df_dofinansowanie_agg = df_dofinansowanie \\\n", + " .groupby(['TERYT pe?ny', 'Rok rozpocz?cia realizacji'])['Dofinansowanie UE (PLN)'].sum().reset_index()\n", + "df_dofinansowanie_agg = df_dofinansowanie_agg \\\n", + " .rename(columns={'TERYT pe?ny': 'Kod', 'Rok rozpocz?cia realizacji': 'Rok', 'Dofinansowanie UE (PLN)': 'Suma'})\n", + "df_dofinansowanie_agg = df_dofinansowanie_agg \\\n", + " .loc[df_dofinansowanie_agg['Kod'].str.len() == 7].reset_index(drop=True)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "..." + ] + }, + { + "cell_type": "code", + "execution_count": 25, + "metadata": {}, + "outputs": [], + "source": [ + "df_podz = pd.read_csv(\n", + " 'PODZ_1410_CREL.csv',\n", + " sep=';',\n", + " converters={'Kod': str})\n", + "df_podz = df_podz[['Kod', 'Rok', 'Wartosc']]\n", + "df_podz = df_podz.loc[df_podz['Kod'].str.endswith(('1', '2', '3'))]\n", + "df_podz = df_podz.dropna()\n", + "df_podz = df_podz.rename(columns={\n", + " 'Wartosc': 'Powierzchnia'})" + ] + }, + { + "cell_type": "code", + "execution_count": 26, + "metadata": {}, + "outputs": [], + "source": [ + "df_wyna = pd.read_csv(\n", + " 'WYNA_2497_CREL.csv',\n", + " sep=';',\n", + " converters={'Kod': str},\n", + " decimal=',')\n", + "df_wyna = df_wyna[['Kod', 'Wyszczególnienie', 'Rok', 'Wartosc']]\n", + "df_wyna = df_wyna.dropna()\n", + "df_wyna = df_wyna.pivot_table(index=['Kod', 'Rok'], columns='Wyszczególnienie', values='Wartosc').reset_index()\n", + "df_wyna = df_wyna.rename(columns={\n", + " 'ogółem': 'Wynagrodzenie_ogolem',\n", + " 'przeciętne miesięczne wynagrodzenia brutto w relacji do średniej krajowej (Polska=100)': 'Wynagrodzenie_w_relacji_do_sredniej'})" + ] + }, + { + "cell_type": "code", + "execution_count": 27, + "metadata": {}, + "outputs": [ + { + "name": "stderr", + "output_type": "stream", + "text": [ + "C:\\Users\\micha\\AppData\\Local\\Temp\\ipykernel_26160\\3644708252.py:1: DtypeWarning: Columns (7) have mixed types. Specify dtype option on import or set low_memory=False.\n", + " df_fina_1 = pd.read_csv(\n" + ] + }, + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
Rodzaje dochodówKodRokDochody_podatek_lesnyDochody_podatek_PCCDochody_podatek_...Dochody_podatek_od_nieruchomosciDochody_podatek_od_spadkowDochody_podatek_od_srodkow_transportowychDochody_podatek_rolnyDochody_podatek_odrebne_ustawyDochody_razem
002010112004NaN549608.00NaN13532989.00NaN625159.0023687.00NaN41378568.00
102010112005NaN609855.00NaN13667398.00NaN700134.0026634.0015438121.0043417443.00
202010112006NaN844223.65NaN14633962.72NaN747182.6411683.6016647124.9850319253.08
302010112007NaN1344365.01NaN14944781.74NaN777345.5219377.3617436387.9362025513.24
4020101120086799.551790135.40NaN16089534.56NaN836441.1030823.6019149551.4580755930.93
....................................
4707832630112018154462.395361951.37572868.36108107448.79437144.83589658.8851297.75115274832.37261780766.79
4707932630112019150329.316088184.20468411.5138527846.59228886.23608637.4064855.1546137150.39167638796.15
4708032630112020156556.525125090.74329522.1278767466.83552009.16558925.6848689.0985538260.14263006955.07
4708132630112021163778.369082482.28492045.2878491368.35947992.83602586.1459824.4689840077.70252345800.93
4708232630112022174823.497474079.651019054.5684996948.99593315.54627169.8650987.0094936379.09259310641.60
\n", + "

47083 rows × 11 columns

\n", + "
" + ], + "text/plain": [ + "Rodzaje dochodów Kod Rok Dochody_podatek_lesny Dochody_podatek_PCC \n", + "0 0201011 2004 NaN 549608.00 \\\n", + "1 0201011 2005 NaN 609855.00 \n", + "2 0201011 2006 NaN 844223.65 \n", + "3 0201011 2007 NaN 1344365.01 \n", + "4 0201011 2008 6799.55 1790135.40 \n", + "... ... ... ... ... \n", + "47078 3263011 2018 154462.39 5361951.37 \n", + "47079 3263011 2019 150329.31 6088184.20 \n", + "47080 3263011 2020 156556.52 5125090.74 \n", + "47081 3263011 2021 163778.36 9082482.28 \n", + "47082 3263011 2022 174823.49 7474079.65 \n", + "\n", + "Rodzaje dochodów Dochody_podatek_... Dochody_podatek_od_nieruchomosci \n", + "0 NaN 13532989.00 \\\n", + "1 NaN 13667398.00 \n", + "2 NaN 14633962.72 \n", + "3 NaN 14944781.74 \n", + "4 NaN 16089534.56 \n", + "... ... ... \n", + "47078 572868.36 108107448.79 \n", + "47079 468411.51 38527846.59 \n", + "47080 329522.12 78767466.83 \n", + "47081 492045.28 78491368.35 \n", + "47082 1019054.56 84996948.99 \n", + "\n", + "Rodzaje dochodów Dochody_podatek_od_spadkow \n", + "0 NaN \\\n", + "1 NaN \n", + "2 NaN \n", + "3 NaN \n", + "4 NaN \n", + "... ... \n", + "47078 437144.83 \n", + "47079 228886.23 \n", + "47080 552009.16 \n", + "47081 947992.83 \n", + "47082 593315.54 \n", + "\n", + "Rodzaje dochodów Dochody_podatek_od_srodkow_transportowych \n", + "0 625159.00 \\\n", + "1 700134.00 \n", + "2 747182.64 \n", + "3 777345.52 \n", + "4 836441.10 \n", + "... ... \n", + "47078 589658.88 \n", + "47079 608637.40 \n", + "47080 558925.68 \n", + "47081 602586.14 \n", + "47082 627169.86 \n", + "\n", + "Rodzaje dochodów Dochody_podatek_rolny Dochody_podatek_odrebne_ustawy \n", + "0 23687.00 NaN \\\n", + "1 26634.00 15438121.00 \n", + "2 11683.60 16647124.98 \n", + "3 19377.36 17436387.93 \n", + "4 30823.60 19149551.45 \n", + "... ... ... \n", + "47078 51297.75 115274832.37 \n", + "47079 64855.15 46137150.39 \n", + "47080 48689.09 85538260.14 \n", + "47081 59824.46 89840077.70 \n", + "47082 50987.00 94936379.09 \n", + "\n", + "Rodzaje dochodów Dochody_razem \n", + "0 41378568.00 \n", + "1 43417443.00 \n", + "2 50319253.08 \n", + "3 62025513.24 \n", + "4 80755930.93 \n", + "... ... \n", + "47078 261780766.79 \n", + "47079 167638796.15 \n", + "47080 263006955.07 \n", + "47081 252345800.93 \n", + "47082 259310641.60 \n", + "\n", + "[47083 rows x 11 columns]" + ] + }, + "execution_count": 27, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df_fina_1 = pd.read_csv(\n", + " 'FINA_2622_CREL_1.csv',\n", + " sep=';',\n", + " converters={'Kod': str},\n", + " decimal=',')\n", + "df_fina_1 = df_fina_1[['Kod', 'Rodzaje dochodów', 'Rok', 'Wartosc']]\n", + "df_fina_1 = df_fina_1.dropna()\n", + "df_fina_1 = df_fina_1.pivot_table(index=['Kod', 'Rok'], columns='Rodzaje dochodów', values='Wartosc').reset_index()\n", + "df_fina_1 = df_fina_1.rename(columns={\n", + " 'dochody podatkowe - podatek leśny': 'Dochody_podatek_lesny',\n", + " 'dochody podatkowe - podatek od czynności cywilnoprawnych': 'Dochody_podatek_PCC',\n", + " 'dochody podatkowe - podatek od działalności gospodarczej osób fizycznych, opłacany w formie karty podatkowej': 'Dochody_podatek_...',\n", + " 'dochody podatkowe - podatek od nieruchomości': 'Dochody_podatek_od_nieruchomosci',\n", + " 'dochody podatkowe - podatek od spadków i darowizn': 'Dochody_podatek_od_spadkow',\n", + " 'dochody podatkowe - podatek od środków transportowych': 'Dochody_podatek_od_srodkow_transportowych',\n", + " 'dochody podatkowe - podatek rolny': 'Dochody_podatek_rolny',\n", + " 'dochody podatkowe - ustalone i pobierane na podstawie odrębnych ustaw': 'Dochody_podatek_odrebne_ustawy',\n", + " 'razem': 'Dochody_razem'})\n", + "\n", + "df_fina_1" + ] + }, + { + "cell_type": "code", + "execution_count": 28, + "metadata": {}, + "outputs": [ + { + "name": "stderr", + "output_type": "stream", + "text": [ + "C:\\Users\\micha\\AppData\\Local\\Temp\\ipykernel_26160\\2161929356.py:1: DtypeWarning: Columns (7) have mixed types. Specify dtype option on import or set low_memory=False.\n", + " df_fina_2 = pd.read_csv(\n" + ] + }, + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
Rodzaje dochodówKodRokDochody_z_majatkuDochody_z_najmu_i_dzierzawyDochody_z_uslugDochody_dofinansowanie_inwestycyjneDochody_dofinansowanie_razemUdzialy_w_podatkach_dochodowych_od_osob_fizycznychUdzialy_w_podatkach_dochodowych_od_osob_prywatnychUdzialy_w_podatkach_dochodowych_razemWplywy_z_innych_lokalnych_oplatWplywy_z_oplaty_eksploatacyjnejWplywy_z_oplaty_skarbowejWplywy_z_oplaty_targowej
0020101120045344205.00NaN184307.00NaN519209.0013285456.001065169.0014350625.0044200.00NaN1209998.00NaN
1020101120054560489.00NaN96462.00NaN9024183.0015985331.001170863.0017156194.0042840.00NaN1282943.00NaN
2020101120068528727.69NaN231470.968752288.988864860.5718101668.001048115.8319149783.8337365.00NaN1203990.73NaN
30201011200715042480.349219682.12339654.1518153240.3018438743.2121785308.001336702.0223122010.0278798.51NaN1228704.53NaN
40201011200822797881.079546379.31787256.695046691.695182137.7923974587.001532633.4425507220.4483882.94NaN1364245.93NaN
.............................................
470783263011201816419859.314261374.831996824.8025285.92237485.3452799183.002690098.1755489281.1710458871.304684.54434077.88608625.90
47079326301120198844350.074324758.682187576.470.00225831.8455319040.002770684.1758089724.1711369287.113456.95415686.53610059.50
470803263011202013485033.976159923.011917372.5521002107.0021192313.0553739656.003144444.3856884100.3812281916.715157.50355201.29507341.00
470813263011202116928500.757582499.624110105.72888293.631072910.8363936763.003975531.9567912294.9517127683.5527746.70416473.030.00
470823263011202230415536.998651170.054117086.30207597.50800347.6364657287.404082611.6468739899.0419150342.255035.87421424.911233266.30
\n", + "

47083 rows × 14 columns

\n", + "
" + ], + "text/plain": [ + "Rodzaje dochodów Kod Rok Dochody_z_majatku \n", + "0 0201011 2004 5344205.00 \\\n", + "1 0201011 2005 4560489.00 \n", + "2 0201011 2006 8528727.69 \n", + "3 0201011 2007 15042480.34 \n", + "4 0201011 2008 22797881.07 \n", + "... ... ... ... \n", + "47078 3263011 2018 16419859.31 \n", + "47079 3263011 2019 8844350.07 \n", + "47080 3263011 2020 13485033.97 \n", + "47081 3263011 2021 16928500.75 \n", + "47082 3263011 2022 30415536.99 \n", + "\n", + "Rodzaje dochodów Dochody_z_najmu_i_dzierzawy Dochody_z_uslug \n", + "0 NaN 184307.00 \\\n", + "1 NaN 96462.00 \n", + "2 NaN 231470.96 \n", + "3 9219682.12 339654.15 \n", + "4 9546379.31 787256.69 \n", + "... ... ... \n", + "47078 4261374.83 1996824.80 \n", + "47079 4324758.68 2187576.47 \n", + "47080 6159923.01 1917372.55 \n", + "47081 7582499.62 4110105.72 \n", + "47082 8651170.05 4117086.30 \n", + "\n", + "Rodzaje dochodów Dochody_dofinansowanie_inwestycyjne \n", + "0 NaN \\\n", + "1 NaN \n", + "2 8752288.98 \n", + "3 18153240.30 \n", + "4 5046691.69 \n", + "... ... \n", + "47078 25285.92 \n", + "47079 0.00 \n", + "47080 21002107.00 \n", + "47081 888293.63 \n", + "47082 207597.50 \n", + "\n", + "Rodzaje dochodów Dochody_dofinansowanie_razem \n", + "0 519209.00 \\\n", + "1 9024183.00 \n", + "2 8864860.57 \n", + "3 18438743.21 \n", + "4 5182137.79 \n", + "... ... \n", + "47078 237485.34 \n", + "47079 225831.84 \n", + "47080 21192313.05 \n", + "47081 1072910.83 \n", + "47082 800347.63 \n", + "\n", + "Rodzaje dochodów Udzialy_w_podatkach_dochodowych_od_osob_fizycznych \n", + "0 13285456.00 \\\n", + "1 15985331.00 \n", + "2 18101668.00 \n", + "3 21785308.00 \n", + "4 23974587.00 \n", + "... ... \n", + "47078 52799183.00 \n", + "47079 55319040.00 \n", + "47080 53739656.00 \n", + "47081 63936763.00 \n", + "47082 64657287.40 \n", + "\n", + "Rodzaje dochodów Udzialy_w_podatkach_dochodowych_od_osob_prywatnych \n", + "0 1065169.00 \\\n", + "1 1170863.00 \n", + "2 1048115.83 \n", + "3 1336702.02 \n", + "4 1532633.44 \n", + "... ... \n", + "47078 2690098.17 \n", + "47079 2770684.17 \n", + "47080 3144444.38 \n", + "47081 3975531.95 \n", + "47082 4082611.64 \n", + "\n", + "Rodzaje dochodów Udzialy_w_podatkach_dochodowych_razem \n", + "0 14350625.00 \\\n", + "1 17156194.00 \n", + "2 19149783.83 \n", + "3 23122010.02 \n", + "4 25507220.44 \n", + "... ... \n", + "47078 55489281.17 \n", + "47079 58089724.17 \n", + "47080 56884100.38 \n", + "47081 67912294.95 \n", + "47082 68739899.04 \n", + "\n", + "Rodzaje dochodów Wplywy_z_innych_lokalnych_oplat \n", + "0 44200.00 \\\n", + "1 42840.00 \n", + "2 37365.00 \n", + "3 78798.51 \n", + "4 83882.94 \n", + "... ... \n", + "47078 10458871.30 \n", + "47079 11369287.11 \n", + "47080 12281916.71 \n", + "47081 17127683.55 \n", + "47082 19150342.25 \n", + "\n", + "Rodzaje dochodów Wplywy_z_oplaty_eksploatacyjnej Wplywy_z_oplaty_skarbowej \n", + "0 NaN 1209998.00 \\\n", + "1 NaN 1282943.00 \n", + "2 NaN 1203990.73 \n", + "3 NaN 1228704.53 \n", + "4 NaN 1364245.93 \n", + "... ... ... \n", + "47078 4684.54 434077.88 \n", + "47079 3456.95 415686.53 \n", + "47080 5157.50 355201.29 \n", + "47081 27746.70 416473.03 \n", + "47082 5035.87 421424.91 \n", + "\n", + "Rodzaje dochodów Wplywy_z_oplaty_targowej \n", + "0 NaN \n", + "1 NaN \n", + "2 NaN \n", + "3 NaN \n", + "4 NaN \n", + "... ... \n", + "47078 608625.90 \n", + "47079 610059.50 \n", + "47080 507341.00 \n", + "47081 0.00 \n", + "47082 1233266.30 \n", + "\n", + "[47083 rows x 14 columns]" + ] + }, + "execution_count": 28, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df_fina_2 = pd.read_csv(\n", + " 'FINA_2622_CREL_2.csv',\n", + " sep=';',\n", + " converters={'Kod': str},\n", + " decimal=',')\n", + "df_fina_2 = df_fina_2[['Kod', 'Rodzaje dochodów', 'Rok', 'Wartosc']]\n", + "df_fina_2 = df_fina_2.dropna()\n", + "df_fina_2 = df_fina_2.pivot_table(index=['Kod', 'Rok'], columns='Rodzaje dochodów', values='Wartosc').reset_index()\n", + "df_fina_2 = df_fina_2.rename(columns={\n", + " 'dochody z majątku': 'Dochody_z_majatku',\n", + " 'dochody z majątku - dochody z najmu i dzierżawy składników majątkowych JST oraz innych umów o podobnym charakterze': 'Dochody_z_najmu_i_dzierzawy',\n", + " 'pozostałe dochody - wpływy z usług': 'Dochody_z_uslug',\n", + " 'pozostałe dochody - środki na dofinansowanie własnych zadań pozyskane z innych źródeł - inwestycyjne': 'Dochody_dofinansowanie_inwestycyjne',\n", + " 'pozostałe dochody - środki na dofinansowanie własnych zadań pozyskane z innych źródeł - razem': 'Dochody_dofinansowanie_razem',\n", + " 'udziały w podatkach stanowiących dochody budżetu państwa podatek dochodowy od osób fizycznych': 'Udzialy_w_podatkach_dochodowych_od_osob_fizycznych',\n", + " 'udziały w podatkach stanowiących dochody budżetu państwa podatek dochodowy od osób prawnych': 'Udzialy_w_podatkach_dochodowych_od_osob_prywatnych',\n", + " 'udziały w podatkach stanowiących dochody budżetu państwa razem': 'Udzialy_w_podatkach_dochodowych_razem',\n", + " 'wpływy z innych lokalnych opłat pobieranych przez jednostki samorządu terytorialnego na podstawie odrębnych ustaw': 'Wplywy_z_innych_lokalnych_oplat',\n", + " 'wpływy z opłaty eksploatacyjnej': 'Wplywy_z_oplaty_eksploatacyjnej',\n", + " 'wpływy z opłaty skarbowej': 'Wplywy_z_oplaty_skarbowej',\n", + " 'wpływy z opłaty targowej': 'Wplywy_z_oplaty_targowej'})\n", + "\n", + "df_fina_2" + ] + }, + { + "cell_type": "code", + "execution_count": 29, + "metadata": {}, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
WiekKodRokLudnosc_ogolemLudnosc_w_wieku_poprodukcyjnymLudnosc_w_wieku_produkcyjnymLudnosc_w_wieku_produkcyjnym_mobilnymLudnosc_w_wieku_produkcyjnym_niemobilnymLudnosc_w_wieku_przedprodukcyjnym
00201011201040309.007683.0026085.0015183.0010902.006541.00
10201011201140119.008020.0025647.0015047.0010600.006452.00
20201011201239851.008392.0025160.0014932.0010228.006299.00
30201011201339603.008678.0024720.0014784.009936.006205.00
40201011201439464.008971.0024307.0014645.009662.006186.00
...........................
486063263011201840910.0010472.0024549.0014683.009866.005889.00
486073263011201940888.0010788.0024209.0014429.009780.005891.00
486083263011202040326.0010962.0023544.0013798.009746.005820.00
486093263011202139834.0011050.0022976.0013277.009699.005808.00
486103263011202239368.0011157.0022486.0012802.009684.005725.00
\n", + "

48611 rows × 8 columns

\n", + "
" + ], + "text/plain": [ + "Wiek Kod Rok Ludnosc_ogolem Ludnosc_w_wieku_poprodukcyjnym \n", + "0 0201011 2010 40309.00 7683.00 \\\n", + "1 0201011 2011 40119.00 8020.00 \n", + "2 0201011 2012 39851.00 8392.00 \n", + "3 0201011 2013 39603.00 8678.00 \n", + "4 0201011 2014 39464.00 8971.00 \n", + "... ... ... ... ... \n", + "48606 3263011 2018 40910.00 10472.00 \n", + "48607 3263011 2019 40888.00 10788.00 \n", + "48608 3263011 2020 40326.00 10962.00 \n", + "48609 3263011 2021 39834.00 11050.00 \n", + "48610 3263011 2022 39368.00 11157.00 \n", + "\n", + "Wiek Ludnosc_w_wieku_produkcyjnym Ludnosc_w_wieku_produkcyjnym_mobilnym \n", + "0 26085.00 15183.00 \\\n", + "1 25647.00 15047.00 \n", + "2 25160.00 14932.00 \n", + "3 24720.00 14784.00 \n", + "4 24307.00 14645.00 \n", + "... ... ... \n", + "48606 24549.00 14683.00 \n", + "48607 24209.00 14429.00 \n", + "48608 23544.00 13798.00 \n", + "48609 22976.00 13277.00 \n", + "48610 22486.00 12802.00 \n", + "\n", + "Wiek Ludnosc_w_wieku_produkcyjnym_niemobilnym \n", + "0 10902.00 \\\n", + "1 10600.00 \n", + "2 10228.00 \n", + "3 9936.00 \n", + "4 9662.00 \n", + "... ... \n", + "48606 9866.00 \n", + "48607 9780.00 \n", + "48608 9746.00 \n", + "48609 9699.00 \n", + "48610 9684.00 \n", + "\n", + "Wiek Ludnosc_w_wieku_przedprodukcyjnym \n", + "0 6541.00 \n", + "1 6452.00 \n", + "2 6299.00 \n", + "3 6205.00 \n", + "4 6186.00 \n", + "... ... \n", + "48606 5889.00 \n", + "48607 5891.00 \n", + "48608 5820.00 \n", + "48609 5808.00 \n", + "48610 5725.00 \n", + "\n", + "[48611 rows x 8 columns]" + ] + }, + "execution_count": 29, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df_ludn_1 = pd.read_csv( # ogolem\n", + " 'LUDN_1342_CREL_1.csv',\n", + " sep=';',\n", + " converters={'Kod': str},\n", + " decimal=',')\n", + "df_ludn_1 = df_ludn_1[['Kod', 'Wiek', 'Rok', 'Wartosc']]\n", + "df_ludn_1 = df_ludn_1.dropna()\n", + "df_ludn_1 = df_ludn_1.pivot_table(index=['Kod', 'Rok'], columns='Wiek', values='Wartosc').reset_index()\n", + "df_ludn_1 = df_ludn_1.rename(columns={\n", + " 'ogółem': 'Ludnosc_ogolem',\n", + " 'w wieku poprodukcyjnym': 'Ludnosc_w_wieku_poprodukcyjnym',\n", + " 'w wieku produkcyjnym': 'Ludnosc_w_wieku_produkcyjnym',\n", + " 'w wieku produkcyjnym mobilnym': 'Ludnosc_w_wieku_produkcyjnym_mobilnym',\n", + " 'w wieku produkcyjnym niemobilnym': 'Ludnosc_w_wieku_produkcyjnym_niemobilnym',\n", + " 'w wieku przedprodukcyjnym': 'Ludnosc_w_wieku_przedprodukcyjnym'})\n", + "\n", + "df_ludn_1" + ] + }, + { + "cell_type": "code", + "execution_count": 30, + "metadata": {}, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
WiekKodRokLudnosc_mezczyzniLudnosc_mezczyzni_w_wieku_poprodukcyjnymLudnosc_mezczyzni_w_wieku_produkcyjnymLudnosc_mezczyzni_w_wieku_produkcyjnym_mobilnymLudnosc_mezczyzni_w_wieku_produkcyjnym_niemobilnymLudnosc_mezczyzni_w_wieku_przedprodukcyjnym
00201011201019085.002153.0013535.007720.005815.003397.00
10201011201118985.002222.0013398.007647.005751.003365.00
20201011201218859.002370.0013238.007611.005627.003251.00
30201011201318737.002477.0013028.007501.005527.003232.00
40201011201418640.002620.0012832.007442.005390.003188.00
...........................
486063263011201819690.003501.0013202.007547.005655.002987.00
486073263011201919683.003644.0013044.007417.005627.002995.00
486083263011202019356.003749.0012617.006986.005631.002990.00
486093263011202119096.003852.0012267.006747.005520.002977.00
486103263011202218869.003901.0012009.006485.005524.002959.00
\n", + "

48611 rows × 8 columns

\n", + "
" + ], + "text/plain": [ + "Wiek Kod Rok Ludnosc_mezczyzni \n", + "0 0201011 2010 19085.00 \\\n", + "1 0201011 2011 18985.00 \n", + "2 0201011 2012 18859.00 \n", + "3 0201011 2013 18737.00 \n", + "4 0201011 2014 18640.00 \n", + "... ... ... ... \n", + "48606 3263011 2018 19690.00 \n", + "48607 3263011 2019 19683.00 \n", + "48608 3263011 2020 19356.00 \n", + "48609 3263011 2021 19096.00 \n", + "48610 3263011 2022 18869.00 \n", + "\n", + "Wiek Ludnosc_mezczyzni_w_wieku_poprodukcyjnym \n", + "0 2153.00 \\\n", + "1 2222.00 \n", + "2 2370.00 \n", + "3 2477.00 \n", + "4 2620.00 \n", + "... ... \n", + "48606 3501.00 \n", + "48607 3644.00 \n", + "48608 3749.00 \n", + "48609 3852.00 \n", + "48610 3901.00 \n", + "\n", + "Wiek Ludnosc_mezczyzni_w_wieku_produkcyjnym \n", + "0 13535.00 \\\n", + "1 13398.00 \n", + "2 13238.00 \n", + "3 13028.00 \n", + "4 12832.00 \n", + "... ... \n", + "48606 13202.00 \n", + "48607 13044.00 \n", + "48608 12617.00 \n", + "48609 12267.00 \n", + "48610 12009.00 \n", + "\n", + "Wiek Ludnosc_mezczyzni_w_wieku_produkcyjnym_mobilnym \n", + "0 7720.00 \\\n", + "1 7647.00 \n", + "2 7611.00 \n", + "3 7501.00 \n", + "4 7442.00 \n", + "... ... \n", + "48606 7547.00 \n", + "48607 7417.00 \n", + "48608 6986.00 \n", + "48609 6747.00 \n", + "48610 6485.00 \n", + "\n", + "Wiek Ludnosc_mezczyzni_w_wieku_produkcyjnym_niemobilnym \n", + "0 5815.00 \\\n", + "1 5751.00 \n", + "2 5627.00 \n", + "3 5527.00 \n", + "4 5390.00 \n", + "... ... \n", + "48606 5655.00 \n", + "48607 5627.00 \n", + "48608 5631.00 \n", + "48609 5520.00 \n", + "48610 5524.00 \n", + "\n", + "Wiek Ludnosc_mezczyzni_w_wieku_przedprodukcyjnym \n", + "0 3397.00 \n", + "1 3365.00 \n", + "2 3251.00 \n", + "3 3232.00 \n", + "4 3188.00 \n", + "... ... \n", + "48606 2987.00 \n", + "48607 2995.00 \n", + "48608 2990.00 \n", + "48609 2977.00 \n", + "48610 2959.00 \n", + "\n", + "[48611 rows x 8 columns]" + ] + }, + "execution_count": 30, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df_ludn_2 = pd.read_csv( # mezczyzni\n", + " 'LUDN_1342_CREL_2.csv',\n", + " sep=';',\n", + " converters={'Kod': str},\n", + " decimal=',')\n", + "df_ludn_2 = df_ludn_2[['Kod', 'Wiek', 'Rok', 'Wartosc']]\n", + "df_ludn_2 = df_ludn_2.dropna()\n", + "df_ludn_2 = df_ludn_2.pivot_table(index=['Kod', 'Rok'], columns='Wiek', values='Wartosc').reset_index()\n", + "df_ludn_2 = df_ludn_2.rename(columns={\n", + " 'ogółem': 'Ludnosc_mezczyzni',\n", + " 'w wieku poprodukcyjnym': 'Ludnosc_mezczyzni_w_wieku_poprodukcyjnym',\n", + " 'w wieku produkcyjnym': 'Ludnosc_mezczyzni_w_wieku_produkcyjnym',\n", + " 'w wieku produkcyjnym mobilnym': 'Ludnosc_mezczyzni_w_wieku_produkcyjnym_mobilnym',\n", + " 'w wieku produkcyjnym niemobilnym': 'Ludnosc_mezczyzni_w_wieku_produkcyjnym_niemobilnym',\n", + " 'w wieku przedprodukcyjnym': 'Ludnosc_mezczyzni_w_wieku_przedprodukcyjnym'})\n", + "\n", + "df_ludn_2" + ] + }, + { + "cell_type": "code", + "execution_count": 31, + "metadata": {}, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
WiekKodRokLudnosc_kobietyLudnosc_kobiety_w_wieku_poprodukcyjnymLudnosc_kobiety_w_wieku_produkcyjnymLudnosc_kobiety_w_wieku_produkcyjnym_mobilnymLudnosc_kobiety_w_wieku_produkcyjnym_niemobilnymLudnosc_kobiety_w_wieku_przedprodukcyjnym
00201011201021224.005530.0012550.007463.005087.003144.00
10201011201121134.005798.0012249.007400.004849.003087.00
20201011201220992.006022.0011922.007321.004601.003048.00
30201011201320866.006201.0011692.007283.004409.002973.00
40201011201420824.006351.0011475.007203.004272.002998.00
...........................
486063263011201821220.006971.0011347.007136.004211.002902.00
486073263011201921205.007144.0011165.007012.004153.002896.00
486083263011202020970.007213.0010927.006812.004115.002830.00
486093263011202120738.007198.0010709.006530.004179.002831.00
486103263011202220499.007256.0010477.006317.004160.002766.00
\n", + "

48611 rows × 8 columns

\n", + "
" + ], + "text/plain": [ + "Wiek Kod Rok Ludnosc_kobiety Ludnosc_kobiety_w_wieku_poprodukcyjnym \n", + "0 0201011 2010 21224.00 5530.00 \\\n", + "1 0201011 2011 21134.00 5798.00 \n", + "2 0201011 2012 20992.00 6022.00 \n", + "3 0201011 2013 20866.00 6201.00 \n", + "4 0201011 2014 20824.00 6351.00 \n", + "... ... ... ... ... \n", + "48606 3263011 2018 21220.00 6971.00 \n", + "48607 3263011 2019 21205.00 7144.00 \n", + "48608 3263011 2020 20970.00 7213.00 \n", + "48609 3263011 2021 20738.00 7198.00 \n", + "48610 3263011 2022 20499.00 7256.00 \n", + "\n", + "Wiek Ludnosc_kobiety_w_wieku_produkcyjnym \n", + "0 12550.00 \\\n", + "1 12249.00 \n", + "2 11922.00 \n", + "3 11692.00 \n", + "4 11475.00 \n", + "... ... \n", + "48606 11347.00 \n", + "48607 11165.00 \n", + "48608 10927.00 \n", + "48609 10709.00 \n", + "48610 10477.00 \n", + "\n", + "Wiek Ludnosc_kobiety_w_wieku_produkcyjnym_mobilnym \n", + "0 7463.00 \\\n", + "1 7400.00 \n", + "2 7321.00 \n", + "3 7283.00 \n", + "4 7203.00 \n", + "... ... \n", + "48606 7136.00 \n", + "48607 7012.00 \n", + "48608 6812.00 \n", + "48609 6530.00 \n", + "48610 6317.00 \n", + "\n", + "Wiek Ludnosc_kobiety_w_wieku_produkcyjnym_niemobilnym \n", + "0 5087.00 \\\n", + "1 4849.00 \n", + "2 4601.00 \n", + "3 4409.00 \n", + "4 4272.00 \n", + "... ... \n", + "48606 4211.00 \n", + "48607 4153.00 \n", + "48608 4115.00 \n", + "48609 4179.00 \n", + "48610 4160.00 \n", + "\n", + "Wiek Ludnosc_kobiety_w_wieku_przedprodukcyjnym \n", + "0 3144.00 \n", + "1 3087.00 \n", + "2 3048.00 \n", + "3 2973.00 \n", + "4 2998.00 \n", + "... ... \n", + "48606 2902.00 \n", + "48607 2896.00 \n", + "48608 2830.00 \n", + "48609 2831.00 \n", + "48610 2766.00 \n", + "\n", + "[48611 rows x 8 columns]" + ] + }, + "execution_count": 31, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df_ludn_3 = pd.read_csv( # kobiety\n", + " 'LUDN_1342_CREL_3.csv',\n", + " sep=';',\n", + " converters={'Kod': str},\n", + " decimal=',')\n", + "df_ludn_3 = df_ludn_3[['Kod', 'Wiek', 'Rok', 'Wartosc']]\n", + "df_ludn_3 = df_ludn_3.dropna()\n", + "df_ludn_3 = df_ludn_3.pivot_table(index=['Kod', 'Rok'], columns='Wiek', values='Wartosc').reset_index()\n", + "df_ludn_3 = df_ludn_3.rename(columns={\n", + " 'ogółem': 'Ludnosc_kobiety',\n", + " 'w wieku poprodukcyjnym': 'Ludnosc_kobiety_w_wieku_poprodukcyjnym',\n", + " 'w wieku produkcyjnym': 'Ludnosc_kobiety_w_wieku_produkcyjnym',\n", + " 'w wieku produkcyjnym mobilnym': 'Ludnosc_kobiety_w_wieku_produkcyjnym_mobilnym',\n", + " 'w wieku produkcyjnym niemobilnym': 'Ludnosc_kobiety_w_wieku_produkcyjnym_niemobilnym',\n", + " 'w wieku przedprodukcyjnym': 'Ludnosc_kobiety_w_wieku_przedprodukcyjnym'})\n", + "\n", + "df_ludn_3" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "..." + ] + }, + { + "cell_type": "code", + "execution_count": 32, + "metadata": {}, + "outputs": [], + "source": [ + "df_data = df_dofinansowanie_agg.copy()" + ] + }, + { + "cell_type": "code", + "execution_count": 33, + "metadata": {}, + "outputs": [], + "source": [ + "df_data = df_data.merge(df_podz, left_on=[df_data['Kod'].str.slice(stop=-1), 'Rok'], right_on=[df_podz['Kod'].str.slice(stop=-1), 'Rok'], how='left', suffixes=(None, '_podz'))\n", + "df_data = df_data.drop(['key_0', 'Kod_podz'], axis=1)" + ] + }, + { + "cell_type": "code", + "execution_count": 34, + "metadata": {}, + "outputs": [], + "source": [ + "df_data = df_data.merge(df_wyna, left_on=[df_data['Kod'].str.slice(stop=-3), 'Rok'], right_on=[df_wyna['Kod'].str.slice(stop=-3), 'Rok'], how='left', suffixes=(None, '_wyna'))\n", + "df_data = df_data.drop(['key_0', 'Kod_wyna'], axis=1)" + ] + }, + { + "cell_type": "code", + "execution_count": 35, + "metadata": {}, + "outputs": [], + "source": [ + "df_data = df_data.merge(df_fina_1, left_on=[df_data['Kod'].str.slice(stop=-1), 'Rok'], right_on=[df_fina_1['Kod'].str.slice(stop=-1), 'Rok'], how='left', suffixes=(None, '_fina_1'))\n", + "df_data = df_data.drop(['key_0', 'Kod_fina_1'], axis=1)\n" + ] + }, + { + "cell_type": "code", + "execution_count": 36, + "metadata": {}, + "outputs": [], + "source": [ + "df_data = df_data.merge(df_fina_2, left_on=[df_data['Kod'].str.slice(stop=-1), 'Rok'], right_on=[df_fina_2['Kod'].str.slice(stop=-1), 'Rok'], how='left', suffixes=(None, '_fina_2'))\n", + "df_data = df_data.drop(['key_0', 'Kod_fina_2'], axis=1)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "..." + ] + }, + { + "cell_type": "code", + "execution_count": 37, + "metadata": {}, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
KodRokSumaPowierzchniaWynagrodzenie_ogolemWynagrodzenie_w_relacji_do_sredniejDochody_podatek_lesnyDochody_podatek_PCCDochody_podatek_...Dochody_podatek_od_nieruchomosci...Dochody_z_uslugDochody_dofinansowanie_inwestycyjneDochody_dofinansowanie_razemUdzialy_w_podatkach_dochodowych_od_osob_fizycznychUdzialy_w_podatkach_dochodowych_od_osob_prywatnychUdzialy_w_podatkach_dochodowych_razemWplywy_z_innych_lokalnych_oplatWplywy_z_oplaty_eksploatacyjnejWplywy_z_oplaty_skarbowejWplywy_z_oplaty_targowej
0020101120142482706.3624.003422.9085.508755.971530935.8084220.5423823448.76...2380938.9161031.321900308.9927297399.001984447.8029281846.807018623.6828867.32928926.81188736.80
1020101120161016449.0324.003666.1985.4014900.551631451.8377726.7021961009.53...3748786.27111299.61284981.4031878605.003726450.7435605055.747277990.6231466.01475771.76158803.00
2020101120171507540.4424.003901.9486.2014988.072022884.7466169.1222107840.97...4137582.8489949.86118699.7434702412.002536379.1337238791.137339238.1424998.04511127.33131562.90
3020101120181125087.7524.004214.6687.2015221.032519471.8674351.8122767685.01...5556645.410.0024676.9239128194.001506913.1840635107.187494838.8816194.57479489.69124935.70
4020101120209052911.4524.004887.9588.5015459.782632509.9974425.1428336580.30...5344170.622640028.002660441.2040456699.002143819.1242600518.127627128.145661.00440259.9062502.50
..................................................................
972332630112017467956789.99197.004536.08100.20150527.435163900.56587305.9474099232.11...1859435.5820000.18212570.7047760120.001199589.0848959709.0810930683.1538789.78404331.07622509.60
97243263011201811972196.58202.004779.0998.80154462.395361951.37572868.36108107448.79...1996824.8025285.92237485.3452799183.002690098.1755489281.1710458871.304684.54434077.88608625.90
9725326301120192074346.69202.005222.62100.80150329.316088184.20468411.5138527846.59...2187576.470.00225831.8455319040.002770684.1758089724.1711369287.113456.95415686.53610059.50
9726326301120208314185.11202.005517.6899.90156556.525125090.74329522.1278767466.83...1917372.5521002107.0021192313.0553739656.003144444.3856884100.3812281916.715157.50355201.29507341.00
972732630112021752819.71202.005564.4192.70163778.369082482.28492045.2878491368.35...4110105.72888293.631072910.8363936763.003975531.9567912294.9517127683.5527746.70416473.030.00
\n", + "

9728 rows × 27 columns

\n", + "
" + ], + "text/plain": [ + " Kod Rok Suma Powierzchnia Wynagrodzenie_ogolem \n", + "0 0201011 2014 2482706.36 24.00 3422.90 \\\n", + "1 0201011 2016 1016449.03 24.00 3666.19 \n", + "2 0201011 2017 1507540.44 24.00 3901.94 \n", + "3 0201011 2018 1125087.75 24.00 4214.66 \n", + "4 0201011 2020 9052911.45 24.00 4887.95 \n", + "... ... ... ... ... ... \n", + "9723 3263011 2017 467956789.99 197.00 4536.08 \n", + "9724 3263011 2018 11972196.58 202.00 4779.09 \n", + "9725 3263011 2019 2074346.69 202.00 5222.62 \n", + "9726 3263011 2020 8314185.11 202.00 5517.68 \n", + "9727 3263011 2021 752819.71 202.00 5564.41 \n", + "\n", + " Wynagrodzenie_w_relacji_do_sredniej Dochody_podatek_lesny \n", + "0 85.50 8755.97 \\\n", + "1 85.40 14900.55 \n", + "2 86.20 14988.07 \n", + "3 87.20 15221.03 \n", + "4 88.50 15459.78 \n", + "... ... ... \n", + "9723 100.20 150527.43 \n", + "9724 98.80 154462.39 \n", + "9725 100.80 150329.31 \n", + "9726 99.90 156556.52 \n", + "9727 92.70 163778.36 \n", + "\n", + " Dochody_podatek_PCC Dochody_podatek_... \n", + "0 1530935.80 84220.54 \\\n", + "1 1631451.83 77726.70 \n", + "2 2022884.74 66169.12 \n", + "3 2519471.86 74351.81 \n", + "4 2632509.99 74425.14 \n", + "... ... ... \n", + "9723 5163900.56 587305.94 \n", + "9724 5361951.37 572868.36 \n", + "9725 6088184.20 468411.51 \n", + "9726 5125090.74 329522.12 \n", + "9727 9082482.28 492045.28 \n", + "\n", + " Dochody_podatek_od_nieruchomosci ... Dochody_z_uslug \n", + "0 23823448.76 ... 2380938.91 \\\n", + "1 21961009.53 ... 3748786.27 \n", + "2 22107840.97 ... 4137582.84 \n", + "3 22767685.01 ... 5556645.41 \n", + "4 28336580.30 ... 5344170.62 \n", + "... ... ... ... \n", + "9723 74099232.11 ... 1859435.58 \n", + "9724 108107448.79 ... 1996824.80 \n", + "9725 38527846.59 ... 2187576.47 \n", + "9726 78767466.83 ... 1917372.55 \n", + "9727 78491368.35 ... 4110105.72 \n", + "\n", + " Dochody_dofinansowanie_inwestycyjne Dochody_dofinansowanie_razem \n", + "0 61031.32 1900308.99 \\\n", + "1 111299.61 284981.40 \n", + "2 89949.86 118699.74 \n", + "3 0.00 24676.92 \n", + "4 2640028.00 2660441.20 \n", + "... ... ... \n", + "9723 20000.18 212570.70 \n", + "9724 25285.92 237485.34 \n", + "9725 0.00 225831.84 \n", + "9726 21002107.00 21192313.05 \n", + "9727 888293.63 1072910.83 \n", + "\n", + " Udzialy_w_podatkach_dochodowych_od_osob_fizycznych \n", + "0 27297399.00 \\\n", + "1 31878605.00 \n", + "2 34702412.00 \n", + "3 39128194.00 \n", + "4 40456699.00 \n", + "... ... \n", + "9723 47760120.00 \n", + "9724 52799183.00 \n", + "9725 55319040.00 \n", + "9726 53739656.00 \n", + "9727 63936763.00 \n", + "\n", + " Udzialy_w_podatkach_dochodowych_od_osob_prywatnych \n", + "0 1984447.80 \\\n", + "1 3726450.74 \n", + "2 2536379.13 \n", + "3 1506913.18 \n", + "4 2143819.12 \n", + "... ... \n", + "9723 1199589.08 \n", + "9724 2690098.17 \n", + "9725 2770684.17 \n", + "9726 3144444.38 \n", + "9727 3975531.95 \n", + "\n", + " Udzialy_w_podatkach_dochodowych_razem Wplywy_z_innych_lokalnych_oplat \n", + "0 29281846.80 7018623.68 \\\n", + "1 35605055.74 7277990.62 \n", + "2 37238791.13 7339238.14 \n", + "3 40635107.18 7494838.88 \n", + "4 42600518.12 7627128.14 \n", + "... ... ... \n", + "9723 48959709.08 10930683.15 \n", + "9724 55489281.17 10458871.30 \n", + "9725 58089724.17 11369287.11 \n", + "9726 56884100.38 12281916.71 \n", + "9727 67912294.95 17127683.55 \n", + "\n", + " Wplywy_z_oplaty_eksploatacyjnej Wplywy_z_oplaty_skarbowej \n", + "0 28867.32 928926.81 \\\n", + "1 31466.01 475771.76 \n", + "2 24998.04 511127.33 \n", + "3 16194.57 479489.69 \n", + "4 5661.00 440259.90 \n", + "... ... ... \n", + "9723 38789.78 404331.07 \n", + "9724 4684.54 434077.88 \n", + "9725 3456.95 415686.53 \n", + "9726 5157.50 355201.29 \n", + "9727 27746.70 416473.03 \n", + "\n", + " Wplywy_z_oplaty_targowej \n", + "0 188736.80 \n", + "1 158803.00 \n", + "2 131562.90 \n", + "3 124935.70 \n", + "4 62502.50 \n", + "... ... \n", + "9723 622509.60 \n", + "9724 608625.90 \n", + "9725 610059.50 \n", + "9726 507341.00 \n", + "9727 0.00 \n", + "\n", + "[9728 rows x 27 columns]" + ] + }, + "execution_count": 37, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df_data" + ] + }, + { + "cell_type": "code", + "execution_count": 38, + "metadata": {}, + "outputs": [], + "source": [ + "# df_data[df_data.isna().any(axis=1)] # ['Rok'].drop_duplicates().reset_index(drop=True)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Preprocessing" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": {}, + "outputs": [], + "source": [] + } + ], + "metadata": { + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.11.3" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +}