{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "..." ] }, { "cell_type": "code", "execution_count": 21, "metadata": {}, "outputs": [], "source": [ "import pandas as pd" ] }, { "cell_type": "code", "execution_count": 22, "metadata": {}, "outputs": [], "source": [ "pd.options.display.float_format = '{:.2f}'.format" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "..." ] }, { "cell_type": "code", "execution_count": 23, "metadata": {}, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "C:\\Users\\micha\\AppData\\Local\\Temp\\ipykernel_26160\\3760256257.py:1: DtypeWarning: Columns (25) have mixed types. Specify dtype option on import or set low_memory=False.\n", " df_dofinansowanie = pd.read_csv(\n" ] } ], "source": [ "df_dofinansowanie = pd.read_csv(\n", " 'umowy_pelna_lista_krajowe.csv',\n", " encoding='ISO-8859-2',\n", " converters={'TERYT pe?ny': str},\n", " thousands=',')\n", "\n", "df_dofinansowanie = df_dofinansowanie.loc[df_dofinansowanie['TERYT pe?ny'] != ''].reset_index(drop=True)\n", "\n", "df_dofinansowanie['Dofinansowanie UE (PLN)'] = \\\n", " df_dofinansowanie['Dofinansowanie UE (PLN)'].apply(pd.to_numeric)\n", "\n", "df_dofinansowanie['Data rozpocz?cia realizacji'] = pd.to_datetime(df_dofinansowanie['Data rozpocz?cia realizacji'])\n", "df_dofinansowanie['Rok rozpocz?cia realizacji'] = df_dofinansowanie['Data rozpocz?cia realizacji'].dt.year\n", "\n", "df_dofinansowanie['Data podpisania umowy pierwotnej'] = pd.to_datetime(df_dofinansowanie['Data podpisania umowy pierwotnej'])\n", "df_dofinansowanie['Rok podpisania umowy pierwotnej'] = df_dofinansowanie['Data podpisania umowy pierwotnej'].dt.year" ] }, { "cell_type": "code", "execution_count": 24, "metadata": {}, "outputs": [], "source": [ "df_dofinansowanie_agg = df_dofinansowanie \\\n", " .groupby(['TERYT pe?ny', 'Rok rozpocz?cia realizacji'])['Dofinansowanie UE (PLN)'].sum().reset_index()\n", "df_dofinansowanie_agg = df_dofinansowanie_agg \\\n", " .rename(columns={'TERYT pe?ny': 'Kod', 'Rok rozpocz?cia realizacji': 'Rok', 'Dofinansowanie UE (PLN)': 'Suma'})\n", "df_dofinansowanie_agg = df_dofinansowanie_agg \\\n", " .loc[df_dofinansowanie_agg['Kod'].str.len() == 7].reset_index(drop=True)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "..." ] }, { "cell_type": "code", "execution_count": 25, "metadata": {}, "outputs": [], "source": [ "df_podz = pd.read_csv(\n", " 'PODZ_1410_CREL.csv',\n", " sep=';',\n", " converters={'Kod': str})\n", "df_podz = df_podz[['Kod', 'Rok', 'Wartosc']]\n", "df_podz = df_podz.loc[df_podz['Kod'].str.endswith(('1', '2', '3'))]\n", "df_podz = df_podz.dropna()\n", "df_podz = df_podz.rename(columns={\n", " 'Wartosc': 'Powierzchnia'})" ] }, { "cell_type": "code", "execution_count": 26, "metadata": {}, "outputs": [], "source": [ "df_wyna = pd.read_csv(\n", " 'WYNA_2497_CREL.csv',\n", " sep=';',\n", " converters={'Kod': str},\n", " decimal=',')\n", "df_wyna = df_wyna[['Kod', 'Wyszczególnienie', 'Rok', 'Wartosc']]\n", "df_wyna = df_wyna.dropna()\n", "df_wyna = df_wyna.pivot_table(index=['Kod', 'Rok'], columns='Wyszczególnienie', values='Wartosc').reset_index()\n", "df_wyna = df_wyna.rename(columns={\n", " 'ogółem': 'Wynagrodzenie_ogolem',\n", " 'przeciętne miesięczne wynagrodzenia brutto w relacji do średniej krajowej (Polska=100)': 'Wynagrodzenie_w_relacji_do_sredniej'})" ] }, { "cell_type": "code", "execution_count": 27, "metadata": {}, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "C:\\Users\\micha\\AppData\\Local\\Temp\\ipykernel_26160\\3644708252.py:1: DtypeWarning: Columns (7) have mixed types. Specify dtype option on import or set low_memory=False.\n", " df_fina_1 = pd.read_csv(\n" ] }, { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Rodzaje dochodówKodRokDochody_podatek_lesnyDochody_podatek_PCCDochody_podatek_...Dochody_podatek_od_nieruchomosciDochody_podatek_od_spadkowDochody_podatek_od_srodkow_transportowychDochody_podatek_rolnyDochody_podatek_odrebne_ustawyDochody_razem
002010112004NaN549608.00NaN13532989.00NaN625159.0023687.00NaN41378568.00
102010112005NaN609855.00NaN13667398.00NaN700134.0026634.0015438121.0043417443.00
202010112006NaN844223.65NaN14633962.72NaN747182.6411683.6016647124.9850319253.08
302010112007NaN1344365.01NaN14944781.74NaN777345.5219377.3617436387.9362025513.24
4020101120086799.551790135.40NaN16089534.56NaN836441.1030823.6019149551.4580755930.93
....................................
4707832630112018154462.395361951.37572868.36108107448.79437144.83589658.8851297.75115274832.37261780766.79
4707932630112019150329.316088184.20468411.5138527846.59228886.23608637.4064855.1546137150.39167638796.15
4708032630112020156556.525125090.74329522.1278767466.83552009.16558925.6848689.0985538260.14263006955.07
4708132630112021163778.369082482.28492045.2878491368.35947992.83602586.1459824.4689840077.70252345800.93
4708232630112022174823.497474079.651019054.5684996948.99593315.54627169.8650987.0094936379.09259310641.60
\n", "

47083 rows × 11 columns

\n", "
" ], "text/plain": [ "Rodzaje dochodów Kod Rok Dochody_podatek_lesny Dochody_podatek_PCC \n", "0 0201011 2004 NaN 549608.00 \\\n", "1 0201011 2005 NaN 609855.00 \n", "2 0201011 2006 NaN 844223.65 \n", "3 0201011 2007 NaN 1344365.01 \n", "4 0201011 2008 6799.55 1790135.40 \n", "... ... ... ... ... \n", "47078 3263011 2018 154462.39 5361951.37 \n", "47079 3263011 2019 150329.31 6088184.20 \n", "47080 3263011 2020 156556.52 5125090.74 \n", "47081 3263011 2021 163778.36 9082482.28 \n", "47082 3263011 2022 174823.49 7474079.65 \n", "\n", "Rodzaje dochodów Dochody_podatek_... Dochody_podatek_od_nieruchomosci \n", "0 NaN 13532989.00 \\\n", "1 NaN 13667398.00 \n", "2 NaN 14633962.72 \n", "3 NaN 14944781.74 \n", "4 NaN 16089534.56 \n", "... ... ... \n", "47078 572868.36 108107448.79 \n", "47079 468411.51 38527846.59 \n", "47080 329522.12 78767466.83 \n", "47081 492045.28 78491368.35 \n", "47082 1019054.56 84996948.99 \n", "\n", "Rodzaje dochodów Dochody_podatek_od_spadkow \n", "0 NaN \\\n", "1 NaN \n", "2 NaN \n", "3 NaN \n", "4 NaN \n", "... ... \n", "47078 437144.83 \n", "47079 228886.23 \n", "47080 552009.16 \n", "47081 947992.83 \n", "47082 593315.54 \n", "\n", "Rodzaje dochodów Dochody_podatek_od_srodkow_transportowych \n", "0 625159.00 \\\n", "1 700134.00 \n", "2 747182.64 \n", "3 777345.52 \n", "4 836441.10 \n", "... ... \n", "47078 589658.88 \n", "47079 608637.40 \n", "47080 558925.68 \n", "47081 602586.14 \n", "47082 627169.86 \n", "\n", "Rodzaje dochodów Dochody_podatek_rolny Dochody_podatek_odrebne_ustawy \n", "0 23687.00 NaN \\\n", "1 26634.00 15438121.00 \n", "2 11683.60 16647124.98 \n", "3 19377.36 17436387.93 \n", "4 30823.60 19149551.45 \n", "... ... ... \n", "47078 51297.75 115274832.37 \n", "47079 64855.15 46137150.39 \n", "47080 48689.09 85538260.14 \n", "47081 59824.46 89840077.70 \n", "47082 50987.00 94936379.09 \n", "\n", "Rodzaje dochodów Dochody_razem \n", "0 41378568.00 \n", "1 43417443.00 \n", "2 50319253.08 \n", "3 62025513.24 \n", "4 80755930.93 \n", "... ... \n", "47078 261780766.79 \n", "47079 167638796.15 \n", "47080 263006955.07 \n", "47081 252345800.93 \n", "47082 259310641.60 \n", "\n", "[47083 rows x 11 columns]" ] }, "execution_count": 27, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_fina_1 = pd.read_csv(\n", " 'FINA_2622_CREL_1.csv',\n", " sep=';',\n", " converters={'Kod': str},\n", " decimal=',')\n", "df_fina_1 = df_fina_1[['Kod', 'Rodzaje dochodów', 'Rok', 'Wartosc']]\n", "df_fina_1 = df_fina_1.dropna()\n", "df_fina_1 = df_fina_1.pivot_table(index=['Kod', 'Rok'], columns='Rodzaje dochodów', values='Wartosc').reset_index()\n", "df_fina_1 = df_fina_1.rename(columns={\n", " 'dochody podatkowe - podatek leśny': 'Dochody_podatek_lesny',\n", " 'dochody podatkowe - podatek od czynności cywilnoprawnych': 'Dochody_podatek_PCC',\n", " 'dochody podatkowe - podatek od działalności gospodarczej osób fizycznych, opłacany w formie karty podatkowej': 'Dochody_podatek_...',\n", " 'dochody podatkowe - podatek od nieruchomości': 'Dochody_podatek_od_nieruchomosci',\n", " 'dochody podatkowe - podatek od spadków i darowizn': 'Dochody_podatek_od_spadkow',\n", " 'dochody podatkowe - podatek od środków transportowych': 'Dochody_podatek_od_srodkow_transportowych',\n", " 'dochody podatkowe - podatek rolny': 'Dochody_podatek_rolny',\n", " 'dochody podatkowe - ustalone i pobierane na podstawie odrębnych ustaw': 'Dochody_podatek_odrebne_ustawy',\n", " 'razem': 'Dochody_razem'})\n", "\n", "df_fina_1" ] }, { "cell_type": "code", "execution_count": 28, "metadata": {}, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "C:\\Users\\micha\\AppData\\Local\\Temp\\ipykernel_26160\\2161929356.py:1: DtypeWarning: Columns (7) have mixed types. Specify dtype option on import or set low_memory=False.\n", " df_fina_2 = pd.read_csv(\n" ] }, { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Rodzaje dochodówKodRokDochody_z_majatkuDochody_z_najmu_i_dzierzawyDochody_z_uslugDochody_dofinansowanie_inwestycyjneDochody_dofinansowanie_razemUdzialy_w_podatkach_dochodowych_od_osob_fizycznychUdzialy_w_podatkach_dochodowych_od_osob_prywatnychUdzialy_w_podatkach_dochodowych_razemWplywy_z_innych_lokalnych_oplatWplywy_z_oplaty_eksploatacyjnejWplywy_z_oplaty_skarbowejWplywy_z_oplaty_targowej
0020101120045344205.00NaN184307.00NaN519209.0013285456.001065169.0014350625.0044200.00NaN1209998.00NaN
1020101120054560489.00NaN96462.00NaN9024183.0015985331.001170863.0017156194.0042840.00NaN1282943.00NaN
2020101120068528727.69NaN231470.968752288.988864860.5718101668.001048115.8319149783.8337365.00NaN1203990.73NaN
30201011200715042480.349219682.12339654.1518153240.3018438743.2121785308.001336702.0223122010.0278798.51NaN1228704.53NaN
40201011200822797881.079546379.31787256.695046691.695182137.7923974587.001532633.4425507220.4483882.94NaN1364245.93NaN
.............................................
470783263011201816419859.314261374.831996824.8025285.92237485.3452799183.002690098.1755489281.1710458871.304684.54434077.88608625.90
47079326301120198844350.074324758.682187576.470.00225831.8455319040.002770684.1758089724.1711369287.113456.95415686.53610059.50
470803263011202013485033.976159923.011917372.5521002107.0021192313.0553739656.003144444.3856884100.3812281916.715157.50355201.29507341.00
470813263011202116928500.757582499.624110105.72888293.631072910.8363936763.003975531.9567912294.9517127683.5527746.70416473.030.00
470823263011202230415536.998651170.054117086.30207597.50800347.6364657287.404082611.6468739899.0419150342.255035.87421424.911233266.30
\n", "

47083 rows × 14 columns

\n", "
" ], "text/plain": [ "Rodzaje dochodów Kod Rok Dochody_z_majatku \n", "0 0201011 2004 5344205.00 \\\n", "1 0201011 2005 4560489.00 \n", "2 0201011 2006 8528727.69 \n", "3 0201011 2007 15042480.34 \n", "4 0201011 2008 22797881.07 \n", "... ... ... ... \n", "47078 3263011 2018 16419859.31 \n", "47079 3263011 2019 8844350.07 \n", "47080 3263011 2020 13485033.97 \n", "47081 3263011 2021 16928500.75 \n", "47082 3263011 2022 30415536.99 \n", "\n", "Rodzaje dochodów Dochody_z_najmu_i_dzierzawy Dochody_z_uslug \n", "0 NaN 184307.00 \\\n", "1 NaN 96462.00 \n", "2 NaN 231470.96 \n", "3 9219682.12 339654.15 \n", "4 9546379.31 787256.69 \n", "... ... ... \n", "47078 4261374.83 1996824.80 \n", "47079 4324758.68 2187576.47 \n", "47080 6159923.01 1917372.55 \n", "47081 7582499.62 4110105.72 \n", "47082 8651170.05 4117086.30 \n", "\n", "Rodzaje dochodów Dochody_dofinansowanie_inwestycyjne \n", "0 NaN \\\n", "1 NaN \n", "2 8752288.98 \n", "3 18153240.30 \n", "4 5046691.69 \n", "... ... \n", "47078 25285.92 \n", "47079 0.00 \n", "47080 21002107.00 \n", "47081 888293.63 \n", "47082 207597.50 \n", "\n", "Rodzaje dochodów Dochody_dofinansowanie_razem \n", "0 519209.00 \\\n", "1 9024183.00 \n", "2 8864860.57 \n", "3 18438743.21 \n", "4 5182137.79 \n", "... ... \n", "47078 237485.34 \n", "47079 225831.84 \n", "47080 21192313.05 \n", "47081 1072910.83 \n", "47082 800347.63 \n", "\n", "Rodzaje dochodów Udzialy_w_podatkach_dochodowych_od_osob_fizycznych \n", "0 13285456.00 \\\n", "1 15985331.00 \n", "2 18101668.00 \n", "3 21785308.00 \n", "4 23974587.00 \n", "... ... \n", "47078 52799183.00 \n", "47079 55319040.00 \n", "47080 53739656.00 \n", "47081 63936763.00 \n", "47082 64657287.40 \n", "\n", "Rodzaje dochodów Udzialy_w_podatkach_dochodowych_od_osob_prywatnych \n", "0 1065169.00 \\\n", "1 1170863.00 \n", "2 1048115.83 \n", "3 1336702.02 \n", "4 1532633.44 \n", "... ... \n", "47078 2690098.17 \n", "47079 2770684.17 \n", "47080 3144444.38 \n", "47081 3975531.95 \n", "47082 4082611.64 \n", "\n", "Rodzaje dochodów Udzialy_w_podatkach_dochodowych_razem \n", "0 14350625.00 \\\n", "1 17156194.00 \n", "2 19149783.83 \n", "3 23122010.02 \n", "4 25507220.44 \n", "... ... \n", "47078 55489281.17 \n", "47079 58089724.17 \n", "47080 56884100.38 \n", "47081 67912294.95 \n", "47082 68739899.04 \n", "\n", "Rodzaje dochodów Wplywy_z_innych_lokalnych_oplat \n", "0 44200.00 \\\n", "1 42840.00 \n", "2 37365.00 \n", "3 78798.51 \n", "4 83882.94 \n", "... ... \n", "47078 10458871.30 \n", "47079 11369287.11 \n", "47080 12281916.71 \n", "47081 17127683.55 \n", "47082 19150342.25 \n", "\n", "Rodzaje dochodów Wplywy_z_oplaty_eksploatacyjnej Wplywy_z_oplaty_skarbowej \n", "0 NaN 1209998.00 \\\n", "1 NaN 1282943.00 \n", "2 NaN 1203990.73 \n", "3 NaN 1228704.53 \n", "4 NaN 1364245.93 \n", "... ... ... \n", "47078 4684.54 434077.88 \n", "47079 3456.95 415686.53 \n", "47080 5157.50 355201.29 \n", "47081 27746.70 416473.03 \n", "47082 5035.87 421424.91 \n", "\n", "Rodzaje dochodów Wplywy_z_oplaty_targowej \n", "0 NaN \n", "1 NaN \n", "2 NaN \n", "3 NaN \n", "4 NaN \n", "... ... \n", "47078 608625.90 \n", "47079 610059.50 \n", "47080 507341.00 \n", "47081 0.00 \n", "47082 1233266.30 \n", "\n", "[47083 rows x 14 columns]" ] }, "execution_count": 28, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_fina_2 = pd.read_csv(\n", " 'FINA_2622_CREL_2.csv',\n", " sep=';',\n", " converters={'Kod': str},\n", " decimal=',')\n", "df_fina_2 = df_fina_2[['Kod', 'Rodzaje dochodów', 'Rok', 'Wartosc']]\n", "df_fina_2 = df_fina_2.dropna()\n", "df_fina_2 = df_fina_2.pivot_table(index=['Kod', 'Rok'], columns='Rodzaje dochodów', values='Wartosc').reset_index()\n", "df_fina_2 = df_fina_2.rename(columns={\n", " 'dochody z majątku': 'Dochody_z_majatku',\n", " 'dochody z majątku - dochody z najmu i dzierżawy składników majątkowych JST oraz innych umów o podobnym charakterze': 'Dochody_z_najmu_i_dzierzawy',\n", " 'pozostałe dochody - wpływy z usług': 'Dochody_z_uslug',\n", " 'pozostałe dochody - środki na dofinansowanie własnych zadań pozyskane z innych źródeł - inwestycyjne': 'Dochody_dofinansowanie_inwestycyjne',\n", " 'pozostałe dochody - środki na dofinansowanie własnych zadań pozyskane z innych źródeł - razem': 'Dochody_dofinansowanie_razem',\n", " 'udziały w podatkach stanowiących dochody budżetu państwa podatek dochodowy od osób fizycznych': 'Udzialy_w_podatkach_dochodowych_od_osob_fizycznych',\n", " 'udziały w podatkach stanowiących dochody budżetu państwa podatek dochodowy od osób prawnych': 'Udzialy_w_podatkach_dochodowych_od_osob_prywatnych',\n", " 'udziały w podatkach stanowiących dochody budżetu państwa razem': 'Udzialy_w_podatkach_dochodowych_razem',\n", " 'wpływy z innych lokalnych opłat pobieranych przez jednostki samorządu terytorialnego na podstawie odrębnych ustaw': 'Wplywy_z_innych_lokalnych_oplat',\n", " 'wpływy z opłaty eksploatacyjnej': 'Wplywy_z_oplaty_eksploatacyjnej',\n", " 'wpływy z opłaty skarbowej': 'Wplywy_z_oplaty_skarbowej',\n", " 'wpływy z opłaty targowej': 'Wplywy_z_oplaty_targowej'})\n", "\n", "df_fina_2" ] }, { "cell_type": "code", "execution_count": 29, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
WiekKodRokLudnosc_ogolemLudnosc_w_wieku_poprodukcyjnymLudnosc_w_wieku_produkcyjnymLudnosc_w_wieku_produkcyjnym_mobilnymLudnosc_w_wieku_produkcyjnym_niemobilnymLudnosc_w_wieku_przedprodukcyjnym
00201011201040309.007683.0026085.0015183.0010902.006541.00
10201011201140119.008020.0025647.0015047.0010600.006452.00
20201011201239851.008392.0025160.0014932.0010228.006299.00
30201011201339603.008678.0024720.0014784.009936.006205.00
40201011201439464.008971.0024307.0014645.009662.006186.00
...........................
486063263011201840910.0010472.0024549.0014683.009866.005889.00
486073263011201940888.0010788.0024209.0014429.009780.005891.00
486083263011202040326.0010962.0023544.0013798.009746.005820.00
486093263011202139834.0011050.0022976.0013277.009699.005808.00
486103263011202239368.0011157.0022486.0012802.009684.005725.00
\n", "

48611 rows × 8 columns

\n", "
" ], "text/plain": [ "Wiek Kod Rok Ludnosc_ogolem Ludnosc_w_wieku_poprodukcyjnym \n", "0 0201011 2010 40309.00 7683.00 \\\n", "1 0201011 2011 40119.00 8020.00 \n", "2 0201011 2012 39851.00 8392.00 \n", "3 0201011 2013 39603.00 8678.00 \n", "4 0201011 2014 39464.00 8971.00 \n", "... ... ... ... ... \n", "48606 3263011 2018 40910.00 10472.00 \n", "48607 3263011 2019 40888.00 10788.00 \n", "48608 3263011 2020 40326.00 10962.00 \n", "48609 3263011 2021 39834.00 11050.00 \n", "48610 3263011 2022 39368.00 11157.00 \n", "\n", "Wiek Ludnosc_w_wieku_produkcyjnym Ludnosc_w_wieku_produkcyjnym_mobilnym \n", "0 26085.00 15183.00 \\\n", "1 25647.00 15047.00 \n", "2 25160.00 14932.00 \n", "3 24720.00 14784.00 \n", "4 24307.00 14645.00 \n", "... ... ... \n", "48606 24549.00 14683.00 \n", "48607 24209.00 14429.00 \n", "48608 23544.00 13798.00 \n", "48609 22976.00 13277.00 \n", "48610 22486.00 12802.00 \n", "\n", "Wiek Ludnosc_w_wieku_produkcyjnym_niemobilnym \n", "0 10902.00 \\\n", "1 10600.00 \n", "2 10228.00 \n", "3 9936.00 \n", "4 9662.00 \n", "... ... \n", "48606 9866.00 \n", "48607 9780.00 \n", "48608 9746.00 \n", "48609 9699.00 \n", "48610 9684.00 \n", "\n", "Wiek Ludnosc_w_wieku_przedprodukcyjnym \n", "0 6541.00 \n", "1 6452.00 \n", "2 6299.00 \n", "3 6205.00 \n", "4 6186.00 \n", "... ... \n", "48606 5889.00 \n", "48607 5891.00 \n", "48608 5820.00 \n", "48609 5808.00 \n", "48610 5725.00 \n", "\n", "[48611 rows x 8 columns]" ] }, "execution_count": 29, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_ludn_1 = pd.read_csv( # ogolem\n", " 'LUDN_1342_CREL_1.csv',\n", " sep=';',\n", " converters={'Kod': str},\n", " decimal=',')\n", "df_ludn_1 = df_ludn_1[['Kod', 'Wiek', 'Rok', 'Wartosc']]\n", "df_ludn_1 = df_ludn_1.dropna()\n", "df_ludn_1 = df_ludn_1.pivot_table(index=['Kod', 'Rok'], columns='Wiek', values='Wartosc').reset_index()\n", "df_ludn_1 = df_ludn_1.rename(columns={\n", " 'ogółem': 'Ludnosc_ogolem',\n", " 'w wieku poprodukcyjnym': 'Ludnosc_w_wieku_poprodukcyjnym',\n", " 'w wieku produkcyjnym': 'Ludnosc_w_wieku_produkcyjnym',\n", " 'w wieku produkcyjnym mobilnym': 'Ludnosc_w_wieku_produkcyjnym_mobilnym',\n", " 'w wieku produkcyjnym niemobilnym': 'Ludnosc_w_wieku_produkcyjnym_niemobilnym',\n", " 'w wieku przedprodukcyjnym': 'Ludnosc_w_wieku_przedprodukcyjnym'})\n", "\n", "df_ludn_1" ] }, { "cell_type": "code", "execution_count": 30, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
WiekKodRokLudnosc_mezczyzniLudnosc_mezczyzni_w_wieku_poprodukcyjnymLudnosc_mezczyzni_w_wieku_produkcyjnymLudnosc_mezczyzni_w_wieku_produkcyjnym_mobilnymLudnosc_mezczyzni_w_wieku_produkcyjnym_niemobilnymLudnosc_mezczyzni_w_wieku_przedprodukcyjnym
00201011201019085.002153.0013535.007720.005815.003397.00
10201011201118985.002222.0013398.007647.005751.003365.00
20201011201218859.002370.0013238.007611.005627.003251.00
30201011201318737.002477.0013028.007501.005527.003232.00
40201011201418640.002620.0012832.007442.005390.003188.00
...........................
486063263011201819690.003501.0013202.007547.005655.002987.00
486073263011201919683.003644.0013044.007417.005627.002995.00
486083263011202019356.003749.0012617.006986.005631.002990.00
486093263011202119096.003852.0012267.006747.005520.002977.00
486103263011202218869.003901.0012009.006485.005524.002959.00
\n", "

48611 rows × 8 columns

\n", "
" ], "text/plain": [ "Wiek Kod Rok Ludnosc_mezczyzni \n", "0 0201011 2010 19085.00 \\\n", "1 0201011 2011 18985.00 \n", "2 0201011 2012 18859.00 \n", "3 0201011 2013 18737.00 \n", "4 0201011 2014 18640.00 \n", "... ... ... ... \n", "48606 3263011 2018 19690.00 \n", "48607 3263011 2019 19683.00 \n", "48608 3263011 2020 19356.00 \n", "48609 3263011 2021 19096.00 \n", "48610 3263011 2022 18869.00 \n", "\n", "Wiek Ludnosc_mezczyzni_w_wieku_poprodukcyjnym \n", "0 2153.00 \\\n", "1 2222.00 \n", "2 2370.00 \n", "3 2477.00 \n", "4 2620.00 \n", "... ... \n", "48606 3501.00 \n", "48607 3644.00 \n", "48608 3749.00 \n", "48609 3852.00 \n", "48610 3901.00 \n", "\n", "Wiek Ludnosc_mezczyzni_w_wieku_produkcyjnym \n", "0 13535.00 \\\n", "1 13398.00 \n", "2 13238.00 \n", "3 13028.00 \n", "4 12832.00 \n", "... ... \n", "48606 13202.00 \n", "48607 13044.00 \n", "48608 12617.00 \n", "48609 12267.00 \n", "48610 12009.00 \n", "\n", "Wiek Ludnosc_mezczyzni_w_wieku_produkcyjnym_mobilnym \n", "0 7720.00 \\\n", "1 7647.00 \n", "2 7611.00 \n", "3 7501.00 \n", "4 7442.00 \n", "... ... \n", "48606 7547.00 \n", "48607 7417.00 \n", "48608 6986.00 \n", "48609 6747.00 \n", "48610 6485.00 \n", "\n", "Wiek Ludnosc_mezczyzni_w_wieku_produkcyjnym_niemobilnym \n", "0 5815.00 \\\n", "1 5751.00 \n", "2 5627.00 \n", "3 5527.00 \n", "4 5390.00 \n", "... ... \n", "48606 5655.00 \n", "48607 5627.00 \n", "48608 5631.00 \n", "48609 5520.00 \n", "48610 5524.00 \n", "\n", "Wiek Ludnosc_mezczyzni_w_wieku_przedprodukcyjnym \n", "0 3397.00 \n", "1 3365.00 \n", "2 3251.00 \n", "3 3232.00 \n", "4 3188.00 \n", "... ... \n", "48606 2987.00 \n", "48607 2995.00 \n", "48608 2990.00 \n", "48609 2977.00 \n", "48610 2959.00 \n", "\n", "[48611 rows x 8 columns]" ] }, "execution_count": 30, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_ludn_2 = pd.read_csv( # mezczyzni\n", " 'LUDN_1342_CREL_2.csv',\n", " sep=';',\n", " converters={'Kod': str},\n", " decimal=',')\n", "df_ludn_2 = df_ludn_2[['Kod', 'Wiek', 'Rok', 'Wartosc']]\n", "df_ludn_2 = df_ludn_2.dropna()\n", "df_ludn_2 = df_ludn_2.pivot_table(index=['Kod', 'Rok'], columns='Wiek', values='Wartosc').reset_index()\n", "df_ludn_2 = df_ludn_2.rename(columns={\n", " 'ogółem': 'Ludnosc_mezczyzni',\n", " 'w wieku poprodukcyjnym': 'Ludnosc_mezczyzni_w_wieku_poprodukcyjnym',\n", " 'w wieku produkcyjnym': 'Ludnosc_mezczyzni_w_wieku_produkcyjnym',\n", " 'w wieku produkcyjnym mobilnym': 'Ludnosc_mezczyzni_w_wieku_produkcyjnym_mobilnym',\n", " 'w wieku produkcyjnym niemobilnym': 'Ludnosc_mezczyzni_w_wieku_produkcyjnym_niemobilnym',\n", " 'w wieku przedprodukcyjnym': 'Ludnosc_mezczyzni_w_wieku_przedprodukcyjnym'})\n", "\n", "df_ludn_2" ] }, { "cell_type": "code", "execution_count": 31, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
WiekKodRokLudnosc_kobietyLudnosc_kobiety_w_wieku_poprodukcyjnymLudnosc_kobiety_w_wieku_produkcyjnymLudnosc_kobiety_w_wieku_produkcyjnym_mobilnymLudnosc_kobiety_w_wieku_produkcyjnym_niemobilnymLudnosc_kobiety_w_wieku_przedprodukcyjnym
00201011201021224.005530.0012550.007463.005087.003144.00
10201011201121134.005798.0012249.007400.004849.003087.00
20201011201220992.006022.0011922.007321.004601.003048.00
30201011201320866.006201.0011692.007283.004409.002973.00
40201011201420824.006351.0011475.007203.004272.002998.00
...........................
486063263011201821220.006971.0011347.007136.004211.002902.00
486073263011201921205.007144.0011165.007012.004153.002896.00
486083263011202020970.007213.0010927.006812.004115.002830.00
486093263011202120738.007198.0010709.006530.004179.002831.00
486103263011202220499.007256.0010477.006317.004160.002766.00
\n", "

48611 rows × 8 columns

\n", "
" ], "text/plain": [ "Wiek Kod Rok Ludnosc_kobiety Ludnosc_kobiety_w_wieku_poprodukcyjnym \n", "0 0201011 2010 21224.00 5530.00 \\\n", "1 0201011 2011 21134.00 5798.00 \n", "2 0201011 2012 20992.00 6022.00 \n", "3 0201011 2013 20866.00 6201.00 \n", "4 0201011 2014 20824.00 6351.00 \n", "... ... ... ... ... \n", "48606 3263011 2018 21220.00 6971.00 \n", "48607 3263011 2019 21205.00 7144.00 \n", "48608 3263011 2020 20970.00 7213.00 \n", "48609 3263011 2021 20738.00 7198.00 \n", "48610 3263011 2022 20499.00 7256.00 \n", "\n", "Wiek Ludnosc_kobiety_w_wieku_produkcyjnym \n", "0 12550.00 \\\n", "1 12249.00 \n", "2 11922.00 \n", "3 11692.00 \n", "4 11475.00 \n", "... ... \n", "48606 11347.00 \n", "48607 11165.00 \n", "48608 10927.00 \n", "48609 10709.00 \n", "48610 10477.00 \n", "\n", "Wiek Ludnosc_kobiety_w_wieku_produkcyjnym_mobilnym \n", "0 7463.00 \\\n", "1 7400.00 \n", "2 7321.00 \n", "3 7283.00 \n", "4 7203.00 \n", "... ... \n", "48606 7136.00 \n", "48607 7012.00 \n", "48608 6812.00 \n", "48609 6530.00 \n", "48610 6317.00 \n", "\n", "Wiek Ludnosc_kobiety_w_wieku_produkcyjnym_niemobilnym \n", "0 5087.00 \\\n", "1 4849.00 \n", "2 4601.00 \n", "3 4409.00 \n", "4 4272.00 \n", "... ... \n", "48606 4211.00 \n", "48607 4153.00 \n", "48608 4115.00 \n", "48609 4179.00 \n", "48610 4160.00 \n", "\n", "Wiek Ludnosc_kobiety_w_wieku_przedprodukcyjnym \n", "0 3144.00 \n", "1 3087.00 \n", "2 3048.00 \n", "3 2973.00 \n", "4 2998.00 \n", "... ... \n", "48606 2902.00 \n", "48607 2896.00 \n", "48608 2830.00 \n", "48609 2831.00 \n", "48610 2766.00 \n", "\n", "[48611 rows x 8 columns]" ] }, "execution_count": 31, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_ludn_3 = pd.read_csv( # kobiety\n", " 'LUDN_1342_CREL_3.csv',\n", " sep=';',\n", " converters={'Kod': str},\n", " decimal=',')\n", "df_ludn_3 = df_ludn_3[['Kod', 'Wiek', 'Rok', 'Wartosc']]\n", "df_ludn_3 = df_ludn_3.dropna()\n", "df_ludn_3 = df_ludn_3.pivot_table(index=['Kod', 'Rok'], columns='Wiek', values='Wartosc').reset_index()\n", "df_ludn_3 = df_ludn_3.rename(columns={\n", " 'ogółem': 'Ludnosc_kobiety',\n", " 'w wieku poprodukcyjnym': 'Ludnosc_kobiety_w_wieku_poprodukcyjnym',\n", " 'w wieku produkcyjnym': 'Ludnosc_kobiety_w_wieku_produkcyjnym',\n", " 'w wieku produkcyjnym mobilnym': 'Ludnosc_kobiety_w_wieku_produkcyjnym_mobilnym',\n", " 'w wieku produkcyjnym niemobilnym': 'Ludnosc_kobiety_w_wieku_produkcyjnym_niemobilnym',\n", " 'w wieku przedprodukcyjnym': 'Ludnosc_kobiety_w_wieku_przedprodukcyjnym'})\n", "\n", "df_ludn_3" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "..." ] }, { "cell_type": "code", "execution_count": 32, "metadata": {}, "outputs": [], "source": [ "df_data = df_dofinansowanie_agg.copy()" ] }, { "cell_type": "code", "execution_count": 33, "metadata": {}, "outputs": [], "source": [ "df_data = df_data.merge(df_podz, left_on=[df_data['Kod'].str.slice(stop=-1), 'Rok'], right_on=[df_podz['Kod'].str.slice(stop=-1), 'Rok'], how='left', suffixes=(None, '_podz'))\n", "df_data = df_data.drop(['key_0', 'Kod_podz'], axis=1)" ] }, { "cell_type": "code", "execution_count": 34, "metadata": {}, "outputs": [], "source": [ "df_data = df_data.merge(df_wyna, left_on=[df_data['Kod'].str.slice(stop=-3), 'Rok'], right_on=[df_wyna['Kod'].str.slice(stop=-3), 'Rok'], how='left', suffixes=(None, '_wyna'))\n", "df_data = df_data.drop(['key_0', 'Kod_wyna'], axis=1)" ] }, { "cell_type": "code", "execution_count": 35, "metadata": {}, "outputs": [], "source": [ "df_data = df_data.merge(df_fina_1, left_on=[df_data['Kod'].str.slice(stop=-1), 'Rok'], right_on=[df_fina_1['Kod'].str.slice(stop=-1), 'Rok'], how='left', suffixes=(None, '_fina_1'))\n", "df_data = df_data.drop(['key_0', 'Kod_fina_1'], axis=1)\n" ] }, { "cell_type": "code", "execution_count": 36, "metadata": {}, "outputs": [], "source": [ "df_data = df_data.merge(df_fina_2, left_on=[df_data['Kod'].str.slice(stop=-1), 'Rok'], right_on=[df_fina_2['Kod'].str.slice(stop=-1), 'Rok'], how='left', suffixes=(None, '_fina_2'))\n", "df_data = df_data.drop(['key_0', 'Kod_fina_2'], axis=1)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "..." ] }, { "cell_type": "code", "execution_count": 37, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
KodRokSumaPowierzchniaWynagrodzenie_ogolemWynagrodzenie_w_relacji_do_sredniejDochody_podatek_lesnyDochody_podatek_PCCDochody_podatek_...Dochody_podatek_od_nieruchomosci...Dochody_z_uslugDochody_dofinansowanie_inwestycyjneDochody_dofinansowanie_razemUdzialy_w_podatkach_dochodowych_od_osob_fizycznychUdzialy_w_podatkach_dochodowych_od_osob_prywatnychUdzialy_w_podatkach_dochodowych_razemWplywy_z_innych_lokalnych_oplatWplywy_z_oplaty_eksploatacyjnejWplywy_z_oplaty_skarbowejWplywy_z_oplaty_targowej
0020101120142482706.3624.003422.9085.508755.971530935.8084220.5423823448.76...2380938.9161031.321900308.9927297399.001984447.8029281846.807018623.6828867.32928926.81188736.80
1020101120161016449.0324.003666.1985.4014900.551631451.8377726.7021961009.53...3748786.27111299.61284981.4031878605.003726450.7435605055.747277990.6231466.01475771.76158803.00
2020101120171507540.4424.003901.9486.2014988.072022884.7466169.1222107840.97...4137582.8489949.86118699.7434702412.002536379.1337238791.137339238.1424998.04511127.33131562.90
3020101120181125087.7524.004214.6687.2015221.032519471.8674351.8122767685.01...5556645.410.0024676.9239128194.001506913.1840635107.187494838.8816194.57479489.69124935.70
4020101120209052911.4524.004887.9588.5015459.782632509.9974425.1428336580.30...5344170.622640028.002660441.2040456699.002143819.1242600518.127627128.145661.00440259.9062502.50
..................................................................
972332630112017467956789.99197.004536.08100.20150527.435163900.56587305.9474099232.11...1859435.5820000.18212570.7047760120.001199589.0848959709.0810930683.1538789.78404331.07622509.60
97243263011201811972196.58202.004779.0998.80154462.395361951.37572868.36108107448.79...1996824.8025285.92237485.3452799183.002690098.1755489281.1710458871.304684.54434077.88608625.90
9725326301120192074346.69202.005222.62100.80150329.316088184.20468411.5138527846.59...2187576.470.00225831.8455319040.002770684.1758089724.1711369287.113456.95415686.53610059.50
9726326301120208314185.11202.005517.6899.90156556.525125090.74329522.1278767466.83...1917372.5521002107.0021192313.0553739656.003144444.3856884100.3812281916.715157.50355201.29507341.00
972732630112021752819.71202.005564.4192.70163778.369082482.28492045.2878491368.35...4110105.72888293.631072910.8363936763.003975531.9567912294.9517127683.5527746.70416473.030.00
\n", "

9728 rows × 27 columns

\n", "
" ], "text/plain": [ " Kod Rok Suma Powierzchnia Wynagrodzenie_ogolem \n", "0 0201011 2014 2482706.36 24.00 3422.90 \\\n", "1 0201011 2016 1016449.03 24.00 3666.19 \n", "2 0201011 2017 1507540.44 24.00 3901.94 \n", "3 0201011 2018 1125087.75 24.00 4214.66 \n", "4 0201011 2020 9052911.45 24.00 4887.95 \n", "... ... ... ... ... ... \n", "9723 3263011 2017 467956789.99 197.00 4536.08 \n", "9724 3263011 2018 11972196.58 202.00 4779.09 \n", "9725 3263011 2019 2074346.69 202.00 5222.62 \n", "9726 3263011 2020 8314185.11 202.00 5517.68 \n", "9727 3263011 2021 752819.71 202.00 5564.41 \n", "\n", " Wynagrodzenie_w_relacji_do_sredniej Dochody_podatek_lesny \n", "0 85.50 8755.97 \\\n", "1 85.40 14900.55 \n", "2 86.20 14988.07 \n", "3 87.20 15221.03 \n", "4 88.50 15459.78 \n", "... ... ... \n", "9723 100.20 150527.43 \n", "9724 98.80 154462.39 \n", "9725 100.80 150329.31 \n", "9726 99.90 156556.52 \n", "9727 92.70 163778.36 \n", "\n", " Dochody_podatek_PCC Dochody_podatek_... \n", "0 1530935.80 84220.54 \\\n", "1 1631451.83 77726.70 \n", "2 2022884.74 66169.12 \n", "3 2519471.86 74351.81 \n", "4 2632509.99 74425.14 \n", "... ... ... \n", "9723 5163900.56 587305.94 \n", "9724 5361951.37 572868.36 \n", "9725 6088184.20 468411.51 \n", "9726 5125090.74 329522.12 \n", "9727 9082482.28 492045.28 \n", "\n", " Dochody_podatek_od_nieruchomosci ... Dochody_z_uslug \n", "0 23823448.76 ... 2380938.91 \\\n", "1 21961009.53 ... 3748786.27 \n", "2 22107840.97 ... 4137582.84 \n", "3 22767685.01 ... 5556645.41 \n", "4 28336580.30 ... 5344170.62 \n", "... ... ... ... \n", "9723 74099232.11 ... 1859435.58 \n", "9724 108107448.79 ... 1996824.80 \n", "9725 38527846.59 ... 2187576.47 \n", "9726 78767466.83 ... 1917372.55 \n", "9727 78491368.35 ... 4110105.72 \n", "\n", " Dochody_dofinansowanie_inwestycyjne Dochody_dofinansowanie_razem \n", "0 61031.32 1900308.99 \\\n", "1 111299.61 284981.40 \n", "2 89949.86 118699.74 \n", "3 0.00 24676.92 \n", "4 2640028.00 2660441.20 \n", "... ... ... \n", "9723 20000.18 212570.70 \n", "9724 25285.92 237485.34 \n", "9725 0.00 225831.84 \n", "9726 21002107.00 21192313.05 \n", "9727 888293.63 1072910.83 \n", "\n", " Udzialy_w_podatkach_dochodowych_od_osob_fizycznych \n", "0 27297399.00 \\\n", "1 31878605.00 \n", "2 34702412.00 \n", "3 39128194.00 \n", "4 40456699.00 \n", "... ... \n", "9723 47760120.00 \n", "9724 52799183.00 \n", "9725 55319040.00 \n", "9726 53739656.00 \n", "9727 63936763.00 \n", "\n", " Udzialy_w_podatkach_dochodowych_od_osob_prywatnych \n", "0 1984447.80 \\\n", "1 3726450.74 \n", "2 2536379.13 \n", "3 1506913.18 \n", "4 2143819.12 \n", "... ... \n", "9723 1199589.08 \n", "9724 2690098.17 \n", "9725 2770684.17 \n", "9726 3144444.38 \n", "9727 3975531.95 \n", "\n", " Udzialy_w_podatkach_dochodowych_razem Wplywy_z_innych_lokalnych_oplat \n", "0 29281846.80 7018623.68 \\\n", "1 35605055.74 7277990.62 \n", "2 37238791.13 7339238.14 \n", "3 40635107.18 7494838.88 \n", "4 42600518.12 7627128.14 \n", "... ... ... \n", "9723 48959709.08 10930683.15 \n", "9724 55489281.17 10458871.30 \n", "9725 58089724.17 11369287.11 \n", "9726 56884100.38 12281916.71 \n", "9727 67912294.95 17127683.55 \n", "\n", " Wplywy_z_oplaty_eksploatacyjnej Wplywy_z_oplaty_skarbowej \n", "0 28867.32 928926.81 \\\n", "1 31466.01 475771.76 \n", "2 24998.04 511127.33 \n", "3 16194.57 479489.69 \n", "4 5661.00 440259.90 \n", "... ... ... \n", "9723 38789.78 404331.07 \n", "9724 4684.54 434077.88 \n", "9725 3456.95 415686.53 \n", "9726 5157.50 355201.29 \n", "9727 27746.70 416473.03 \n", "\n", " Wplywy_z_oplaty_targowej \n", "0 188736.80 \n", "1 158803.00 \n", "2 131562.90 \n", "3 124935.70 \n", "4 62502.50 \n", "... ... \n", "9723 622509.60 \n", "9724 608625.90 \n", "9725 610059.50 \n", "9726 507341.00 \n", "9727 0.00 \n", "\n", "[9728 rows x 27 columns]" ] }, "execution_count": 37, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_data" ] }, { "cell_type": "code", "execution_count": 38, "metadata": {}, "outputs": [], "source": [ "# df_data[df_data.isna().any(axis=1)] # ['Rok'].drop_duplicates().reset_index(drop=True)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Preprocessing" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.11.3" } }, "nbformat": 4, "nbformat_minor": 2 }