Funkcje analityczne w SQL

To jest jeden z artykułów w ramach praktycznego kursu SQL. Proszę zapoznaj się z pozostałymi częściami, mogą one być pomocne w zrozumieniu materiału z tego artykułu.

Każde zapytanie z kursu możesz wykonać samodzielnie. Potrzebujesz do tego środowiska opisanego w pierwszym artykule kursu. Bardzo mocno Cię do tego zachęcam. Moim zdaniem najwięcej nauczysz się samodzielnie eksperymentując z zapytaniami.

W tym artykule używam funkcji SQLite, które zostały dodane w wersji 3.28.0. Jeśli używasz SQLite do eksperymentowania upewnij się, że korzystasz z wersji 3.28.0 bądź nowszej. Możesz to zrobić używając polecenia sqlite3 --version.

Czym są funkcje analityczne w SQL

W jednym zdaniu można powiedzieć, że funkcje analityczne (ang. analytic functions) zwracają wartość na podstawie grupy wierszy powiązanych z aktualnym wierszem. Tę grupę nazywa się partycją. Sam opis może być skomplikowany, więc proszę spójrz na przykład poniżej:

  SELECT customerid
        ,invoiceid
        ,total
        ,SUM(total) OVER (PARTITION BY customerid) AS customer_total_sum
    FROM invoice
ORDER BY customerid
   LIMIT 10;

Poza funkcją analityczną użyłem tu aliasu kolumny, sortowania i ograniczenia liczby zwracanych wierszy. W wyniku tego zapytania otrzymasz dziesięć wierszy:

CustomerId  InvoiceId  Total  customer_total_sum
----------  ---------  -----  ------------------
         98         3.98   39.62
         121        3.96   39.62
         143        5.94   39.62
         195        0.99   39.62
         316        1.98   39.62
         327        13.86  39.62
         382        8.91   39.62
         1          1.98   37.62
         12         13.86  37.62
         67         8.91   37.62

To zapytanie zwraca cztery różne kolumny. Ostatnia z nich jest wynikiem działania funkcji analitycznej. Spróbuję rozłożyć ją na części pierwsze:

SUM(total)
OVER
(PARTITION BY customerid)

W pierwszej linijce widzisz funkcję SUM. Możesz ją pamiętać z artykułu o funkcjach w SQL. W poprzednim przypadku była ona użyta jako funkcja agregująca. Użycie słowa kluczowego OVER sprawia, że jej zachowanie nieznacznie się zmienia. W tym przypadku SUM nadal zwraca sumę, jednak w przypadku funkcji analitycznej pod uwagę brana jest partycja a nie cała tabela¹.

W ostatniej linijce znajduje się definicja partycji, która zostanie użyta do obliczenia wartości funkcji. W tym przypadku do partycji należą wiersze zawierające taką samą wartość kolumny customerid.

Zatem ta funkcja:

oblicza sumę kolumny total (SUM(total)),
sumując wiersze, które mają taką samą wartość kolumny customerid (PARTITION BY customerid).

Proszę spójrz na pierwszych siedem wierszy, które mają taką samą wartość kolumny customerid. Kolumna total sumowana jest w ramach partycji: 3.98 + 3.96 + 5.94 + 0.99 + 1.98 + 13.86 + 8.91 = 39.62. Wartość ta, będąca wynikiem działania funkcji, jest przypisywana do każdego wiersza z partycji.

Można powiedzieć, że funkcje analityczne są podobne do standardowego grupowania przy użyciu klauzuli GROUP BY. Funkcje agregujące zwracają jeden wiersz dla grupy, funkcje analityczne zwracają wiele wierszy.

Pozostałe funkcje agregujące

Poniżej znajdziesz listę funkcji agregujących, których możesz użyć przed słowem kluczowym OVER:

AVG – zwraca średnią wartość,
COUNT – zwraca liczbę wierszy,
MAX – zwraca maksymalną wartość,
MIN – zwraca minimalną wartość,
SUM – zwraca sumę wartości.

Pobierz opracowania zadań z rozmów kwalifikacyjnych

Przygotowałem rozwiązania kilku zadań algorytmicznych z rozmów kwalifikacyjnych. Rozkładam je na czynniki pierwsze i pokazuję różne sposoby ich rozwiązania. Dołącz do grupy ponad 6147 Samouków, którzy jako pierwsi dowiadują się o nowych treściach na blogu, a prześlę je na Twój e-mail.

Klauzula `PARTITION BY`

W przykładzie wyżej wszystkie wiersze w tabeli invoice zostały podzielone na osobne partycje. Do podziału na partycje użyłem wyłącznie jednej kolumny. W klauzuli PARTITION BY możesz użyć wielu wyrażeń:

SUM(total) OVER
OVER
(PARTITION BY customerid, billingcountry)

W tym przypadku tabela zostanie podzielona na więcej partycji. Do jednej partycji trafią wszystkie wiersze, które mają taką samą wartość kolumn customerid i billingcountry.

Istnieje też możliwość pominięcia klauzuli PARTITION BY:

SUM(total) OVER ()

W takim przypadku partycja równoznaczna jest z całą tabelą². Dla każdego wynikowego wiersza SUM(total) OVER () zwróci sumę kolumny total we wszystkich wierszach.

Kiedy obliczana jest wartość funkcji analitycznej

Funkcje analityczne mogą być użyte wyłącznie w klauzuli SELECT i ORDER BY. Wynika to z faktu, że funkcje analityczne operują na „wirtualnej tabeli” (w modelu relacyjnym można mówić o relacji), która powstanie po filtrowaniu i grupowaniu wierszy.

Można powiedzieć, że zapytanie wykonywane jest w następującej kolejności:

Wykonanie klauzuli WHERE,
Wykonanie klauzuli GROUP BY,
Wykonanie klauzuli HAVING,
Wykonanie funkcji analitycznych,
Wykonanie klauzuli ORDER BY,
Wykonanie klauzuli LIMIT.

Czym jest okno

Tak naprawdę, to funkcja do obliczenia wartości bierze pod uwagę tak zwane okno. Każdy wiersz w partycji ma swoje własne okno, które jest podzbiorem partycji. Jeśli okno nie jest zdefiniowane wówczas przyjmuje ono wartość całej partycji. Istnieje wiele możliwości na ograniczenie okna dla funkcji analitycznej. Najprostszym z nich jest użycie klauzuli ORDER BY.

Ćwiczenia do samodzielnego wykonania

Teraz czas na Twoje eksperymenty. Spróbuj samodzielnie uruchomić przykładowe zapytanie. Możesz je także zmodyfikować:

zmień limit zwracanych wierszy,
zwróć wyłącznie wiersze z parzystą wartością kolumny customerid.

Sortowanie w funkcjach analitycznych

Nieznacznie zmodyfikuję definicję partycji z pierwszego zapytania. Przykład poniżej używa dwóch funkcji. Druga z nich używa ORDER BY invoiceid po definicji partycji:

  SELECT customerid
        ,invoiceid
        ,total
        ,SUM(total) OVER (PARTITION BY customerid) AS customer_total_sum
        ,SUM(total) OVER (PARTITION BY customerid
                              ORDER BY invoiceid) AS customer_total_increasing_sum
    FROM invoice
ORDER BY customerid, invoiceid
   LIMIT 10;

Proszę spójrz na wynik zapytania. Zwróć uwagę na wartości kolumn customer_total_sum i customer_total_increasing_sum:

CustomerId  InvoiceId  Total  customer_total_sum  customer_total_increasing_sum
----------  ---------  -----  ------------------  -----------------------------
         98         3.98   39.62               3.98
         121        3.96   39.62               7.94
         143        5.94   39.62               13.88
         195        0.99   39.62               14.87
         316        1.98   39.62               16.85
         327        13.86  39.62               30.71
         382        8.91   39.62               39.62
         1          1.98   37.62               1.98
         12         13.86  37.62               15.84
         67         8.91   37.62               24.75

Użycie ORDER BY w definicji funkcji analitycznej powoduje zmianę okna dla każdego z wierszy. ORDER BY tworzy „narastające okna” dla każdego kolejnego wiersza:

okno dla pierwszego wiersza to wyłącznie pierwszy wiersz (3.98 = 3.98),
okno dla drugiego wiersza to dwa pierwsze wiersze (3.98 + 3.96 = 7.94),
okno dla trzeciego wiersza to trzy pierwsze wiersze (3.98 + 3.96 + 5.94 = 13.88),
itd.

Zauważ, że w tym przykładzie użyłem dwóch klauzul ORDER BY. Pierwsza z nich służy do określenia okna dla funkcji analitycznej, druga służy do sortowania wyników całego zapytania.

Partycje a sortowanie

Zapytanie używające partycji zwraca dane posortowane zgodnie z definicją partycji. Na przykład wyniki poniższego zapytania będą posortowane używając kolumny customerid:

SELECT customerid
      ,SUM(total) OVER (PARTITION BY customerid) AS customer_total_sum
  FROM invoice

Chociaż dane będą zwrócone w ten sposób nie polegałbym na tym zachowaniu. Jeśli zależy Ci na uzyskaniu posortowanych danych określ to jasno używając klauzuli ORDER BY. W ten sposób jasno określasz swoje intencje:

  SELECT customerid
        ,SUM(total) OVER (PARTITION BY customerid) AS customer_total_sum
    FROM invoice
ORDER BY customerid;

We wszystkich przykładach w artykule dodałem klauzulę ORDER BY.

Ćwiczenia do samodzielnego wykonania

Teraz czas na Twoje eksperymenty. Spróbuj samodzielnie uruchomić przykładowe zapytanie zawierające dwie funkcje analityczne. Możesz je także zmodyfikować:

sprawdź jak na wynik zapytania wpływają różne kolumny użyte do sortowania,
użyj kilku kolumn do sortowania wyników/wierszy w partycji,
użyj DESC/ASC do z zmiany wyniku sortowania.

Unikanie duplikacji – nazwane partycje

Wyobraź sobie sytuację, w której chcesz zwrócić wynik różnych funkcji analitycznych, jednak używając tej samej definicji partycji. Spójrz na przykład poniżej:

  SELECT customerid
        ,invoiceid
        ,total
        ,SUM(total) OVER (PARTITION BY customerid) AS customer_total_sum
        ,AVG(total) OVER (PARTITION BY customerid) AS customer_total_avg
    FROM invoice
ORDER BY customerid
   LIMIT 10;

W tym przykładzie definicja partycji jest prosta. Możesz jednak trafić na przypadek, w którym będzie ona dużo bardziej skomplikowana. Takie zapytanie zawiera duplikację definicji partycji. Duplikacja w większości przypadków jest zła. Nie inaczej jest w przypadku zapytań SQL. W takiej sytuacji z pomocą przychodzi klauzula WINDOW. Proszę spójrz na przykład poniżej, jest on równoznaczny z poprzednim zapytaniem:

  SELECT customerid
        ,invoiceid
        ,total
        ,SUM(total) OVER customer_window AS customer_total_sum
        ,AVG(total) OVER customer_window AS customer_total_avg
    FROM invoice
  WINDOW customer_window AS (PARTITION BY customerid)
ORDER BY customer id
   LIMIT 10;

Oba zapytania zwrócą ten sam wynik:

CustomerId  InvoiceId  Total  customer_total_sum  customer_total_avg
----------  ---------  -----  ------------------  ------------------
         98         3.98   39.62               5.66
         121        3.96   39.62               5.66
         143        5.94   39.62               5.66
         195        0.99   39.62               5.66
         316        1.98   39.62               5.66
         327        13.86  39.62               5.66
         382        8.91   39.62               5.66
         1          1.98   37.62               5.37428571428571
         12         13.86  37.62               5.37428571428571
         67         8.91   37.62               5.37428571428571

Co więcej partycje zdefiniowane w ten sposób możesz dodatkowo rozszerzać:

  SELECT customerid
        ,invoiceid
        ,total
        ,SUM(total) OVER (customer_window ORDER BY invoiceid) AS customer_ordered_total_sum
        ,AVG(total) OVER customer_window AS customer_total_avg
    FROM invoice
  WINDOW customer_window AS (PARTITION BY customerid)
ORDER BY customerid
   LIMIT 10;

W tym przykładzie suma kolumny total jest narastająca:

CustomerId  InvoiceId  Total  customer_ordered_total_sum  customer_total_avg
----------  ---------  -----  --------------------------  ------------------
         98         3.98   3.98                        5.66
         121        3.96   7.94                        5.66
         143        5.94   13.88                       5.66
         195        0.99   14.87                       5.66
         316        1.98   16.85                       5.66
         327        13.86  30.71                       5.66
         382        8.91   39.62                       5.66
         1          1.98   1.98                        5.37428571428571
         12         13.86  15.84                       5.37428571428571
         67         8.91   24.75                       5.37428571428571

Funkcje okna

Jak już wiesz funkcje analityczne działają w oparciu o partycje. Dodatkowo funkcje te pozwalają Ci na zdefiniowanie tak zwanego okna. Domyślnie okno zawiera:

wszystkie wiersze partycji jeśli nie użyjesz klauzuli ORDER BY,
wiersze „do aktualnego wiersza” jeśli użyjesz klauzuli ORDER BY.

Domyślną zawartość okna możesz zmienić. Okno pozwala na dalsze ograniczenie wierszy branych pod uwagę przez funkcję. Składnię można rozszerzyć do:

<funkcja>
OVER
[ PARTITION BY … ]
[ ORDER BY … ]
<definicja okna>

Okno może być jednego z trzech rodzajów:

ROWS – granice okna określone są przez liczbę wierszy przed i po aktualnym wierszu,
GROUPS – granice okna określone są przez liczbę „grup” przed i po aktualnej „grupie”. Do grupy zalicza się te wartości, które są „równe” w trakcie sortowania przy użyciu ORDER BY,
RANGE – granice okna określone są przez różnicę wartości względem aktualnego wiersza.

Dla uproszczenia w definicji okna będę używał wyłącznie BETWEEN x PRECEDING AND y FOLLOWING. Oznacza to, że okno będzie obejmowało zakres x przed aktualnym wierszem i y po aktualnym wierszu. Składania pozwala na dużo bardziej zaawansowane modyfikacje, jednak ich znajomość nie jest niezbędna do zrozumienia działania samego mechanizmu. Jeśli jesteś zainteresowany tymi szczegółami odsyłam Cię do dokumentacji silnika bazy danych, którego używasz.

Mam świadomość, że to wszystko brzmi jak łacina bez konkretnego przykładu. Postaram się to poprawić ;)

Okno typu `ROWS`

Proszę spójrz na pierwszy z nich:

  SELECT customerid
        ,invoiceid
        ,total
        ,SUM(total) OVER (PARTITION BY customerid
                              ORDER BY invoiceid
                                  ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) AS rolling_sum
    FROM invoice
ORDER BY customerid
        ,invoiceid
   LIMIT 10;

W wyniku tego zapytania otrzymasz 10 wierszy:

CustomerId  InvoiceId  Total  rolling_sum
----------  ---------  -----  -----------
         98         3.98   7.94
         121        3.96   13.88
         143        5.94   10.89
         195        0.99   8.91
         316        1.98   16.83
         327        13.86  24.75
         382        8.91   22.77
         1          1.98   15.84
         12         13.86  24.75
         67         8.91   24.75

W tym przypadku SUM(total) sumuje jedynie wiersze należące do okna, a nie całej partycji.

dla pierwszego wiersza oknem są wiersze pierwszy i drugi: 3.98 + 3.96 = 7.94 (brak poprzedniego wiersza w partycji),
dla drugiego wiersza oknem są wiersze pierwszy, drugi i trzeci: 3.98 + 3.96 + 5.94 = 13.88 ,
dla siódmego wiersza oknem są wiersze szósty i siódmy: 13.86 + 8.91 = 22.77 (brak następnego wiersza w partycji).

Okno typu `GROUPS`

Tym razem do utworzenia partycji posłużę się kolumną billingcountry:

  SELECT billingcountry
        ,invoiceid
        ,total
        ,SUM(total) OVER (PARTITION BY billingcountry
                              ORDER BY total
                                GROUPS BETWEEN 1 PRECEDING AND 1 FOLLOWING) AS rolling_sum
    FROM invoice
   WHERE billingcountry = 'India'
ORDER BY total;

W wyniku tego zapytania otrzymasz 13 wierszy:

BillingCountry  InvoiceId  Total  rolling_sum
--------------  ---------  -----  -----------
India           120        1.98   9.92
India           218        1.98   9.92
India           315        1.98   9.92
India           97         1.99   17.84
India           412        1.99   17.84
India           23         3.96   23.78
India           338        3.96   23.78
India           45         5.94   37.62
India           360        5.94   37.62
India           186        8.91   57.42
India           284        8.91   57.42
India           131        13.86  45.54
India           229        13.86  45.54

Także tym przypadku SUM(total) sumuje jedynie wiersze należące do okna, a nie całej partycji:

dla pierwszego wiersza oknem jest pierwszych pięć wierszy. Grupa do której należy pierwszy wiersz i następna grupa: 3 * 1.98 + 2 * 1.99 = 9.92 (brak poprzedniej grupy w partycji),
dla piątego wiersza oknem jest pierwszych siedem wierszy. Grupa poprzedzająca, grupa do której należy piąty wiersz i następna grupa: 3 * 1.98 + 2 * 1.99 + 2 * 3.96 = 17.84 ,
dla przedostatniego wiersza oknem są wiersze 10., 11., 12. i 13.: 2 * 8.91 + 2 * 13.86 (brak następnej grupy w partycji).

Okno typu `RANGE`

W tym przypadku okno definiowane jest jako „odległość” 2 przed i po wartości kolumny total:

  SELECT customerid
        ,invoiceid
        ,total
        ,SUM(total) OVER (PARTITION BY customerid
                              ORDER BY total
                                 RANGE BETWEEN 2 PRECEDING AND 2 FOLLOWING) AS rolling_sum
    FROM invoice
ORDER BY customerid
        ,total
   LIMIT 10;

W wyniku tego zapytania otrzymasz dziesięć wierszy:

CustomerId  InvoiceId  Total  rolling_sum
----------  ---------  -----  -----------
         195        0.99   2.97
         316        1.98   10.91
         121        3.96   15.86
         98         3.98   15.86
         143        5.94   13.88
         382        8.91   8.91
         327        13.86  13.86
         293        0.99   4.95
         1          1.98   8.91
         196        1.98   8.91

Także tutaj SUM(total) sumuje jedynie wiersze należące do okna, a nie całej partycji.

dla pierwszego wiersza oknem są pierwsze dwa wiersze. Dzieje się tak ponieważ wartość kolumny total dla tych wierszy jest w zakresie <0.99 - 2, 0.99 + 2>,
dla drugiego wiersza oknem są pierwsze cztery wiersze. Dzieje się tak ponieważ wartość kolumny total dla tych wierszy jest w zakresie <1.98 - 2, 1.98 + 2>,
dla trzeciego wiersza oknem są wiersze drugi, trzeci, czwarty i piąty. Dzieje się tak ponieważ wartość kolumny total dla tych wierszy jest w zakresie <3.96 - 2, 3.96 + 2>.

Filtrowanie okna

Jakby tego było mało do tego wszystkiego dochodzi możliwość filtrowania :). Oznacza to tyle, że możesz użyć filtrowania jak w klauzuli WHERE, żeby dodatkowo ograniczyć wiersze „pasujące” do definicji okna. Proszę spójrz na przykład poniżej:

  SELECT customerid
        ,invoiceid
        ,total
        ,SUM(total) OVER rows_window AS rolling_sum
        ,SUM(total) FILTER (WHERE invoiceid != 121)
                      OVER rows_window AS filtered_rolling_sum
    FROM invoice
  WINDOW rows_window AS (PARTITION BY customerid)
ORDER BY customerid
   LIMIT 10;

Zwróć uwagę na wartości kolumn rolling_sum i filtered_rolling_sum:

CustomerId  InvoiceId  Total  rolling_sum  filtered_rolling_sum
----------  ---------  -----  -----------  --------------------
         98         3.98   39.62        35.66
         121        3.96   39.62        35.66
         143        5.94   39.62        35.66
         195        0.99   39.62        35.66
         316        1.98   39.62        35.66
         327        13.86  39.62        35.66
         382        8.91   39.62        35.66
         1          1.98   37.62        37.62
         12         13.86  37.62        37.62
         67         8.91   37.62        37.62

filtered_rolling_sum ma wartość 39.62 - 3.96 = 35.66. Zatem funkcja analityczna w przypadku partycji gdzie customerid = 1 nie wzięła pod uwagę filtrowanego wiersza. Wiersz, w którym invoiceid = 121 nie został wzięty pod uwagę podczas sumowania. Dla przypomnienia odsyłam cię do artykułu opisującego klauzulę WHERE.

Lista funkcji

Bazy danych posiadają szereg funkcji dedykowanych do użycia z klauzulą OVER. Poniżej znajdziesz listę zawierającą część z nich. Podobnie jak w innych przypadkach odsyłam Cię do dokumentacji Twojej bazy danych, jeśli chcesz znać ich komplet:

ROW_NUMBER() – Numeruje wiersze w partycji zaczynając od 1. Bierze pod uwagę klauzulę ORDER BY,
RANK(), DENSE_RANK() – Funkcje numerujące unikalne wartości w partycji. RANK zostawia „dziury” w numeracji. Pokażę to na przykładzie poniżej. Bez klauzuli ORDER BY każdy z wierszy ma numer 1,
NTILE(N) – Dzieli partycję na N „możliwie równych” i przydziela wiersze do grup o wartości od 1 do N.

Pierwszy przykład pokazuje działanie funkcji ROW_NUMBER:

SELECT customerid
      ,total
      ,ROW_NUMBER() OVER (PARTITION BY customerid) AS row_number
  FROM invoice
 LIMIT 10;

CustomerId  Total  row_number
----------  -----  ----------
         0.99   1
         1.98   2
         3.96   3
         3.98   4
         5.94   5
         8.91   6
         13.86  7
         0.99   1
         1.98   2
         1.98   3

Drugi przykład porównuje funkcje RANK i DENSE_RANK. Proszę zwróć uwagę na wyniki tych funkcji dla 10. i 11. wiersza:

SELECT customerid
      ,total
      ,RANK() OVER customer_window AS rank_unsorted
      ,DENSE_RANK() OVER customer_window AS dense_rank_unsorted
      ,RANK() OVER (customer_window ORDER BY total) AS rank_sorted
      ,DENSE_RANK() OVER (customer_window ORDER BY total) AS dense_rank_sorted
  FROM invoice
WINDOW customer_window AS (PARTITION BY customerid)
 LIMIT 13;

CustomerId  Total  rank_unsorted  dense_rank_unsorted  rank_sorted  dense_rank_sorted
----------  -----  -------------  -------------------  -----------  -----------------
         0.99   1              1                    1            1
         1.98   1              1                    2            2
         3.96   1              1                    3            3
         3.98   1              1                    4            4
         5.94   1              1                    5            5
         8.91   1              1                    6            6
         13.86  1              1                    7            7
         0.99   1              1                    1            1
         1.98   1              1                    2            2
         1.98   1              1                    2            2
         3.96   1              1                    4            3
         5.94   1              1                    5            4
         8.91   1              1                    6            5

Ostatni przykład pokazuje sposób podziału partycji przez funkcję NTILE z użyciem różnych argumentów:

SELECT customerid
      ,total
      ,NTILE(2) OVER customer_window AS ntile_2
      ,NTILE(4) OVER customer_window AS ntile_4
  FROM invoice
WINDOW customer_window AS (PARTITION BY customerid)
 LIMIT 10;

CustomerId  Total  ntile_2  ntile_4
----------  -----  -------  -------
         3.98   1        1
         3.96   1        1
         5.94   1        2
         0.99   1        2
         1.98   2        3
         13.86  2        3
         8.91   2        4
         1.98   1        1
         13.86  1        1
         8.91   1        2

Funkcje analityczne a klauzula `WHERE`

Jak już wiesz funkcje analityczne mogą być użyte wyłącznie w klauzuli SELECT i ORDER BY. Co jeśli musisz użyć wyniku funkcji analitycznej do filtrowania? Z pomocą przychodzą podzapytania. Na przykład poniższe zapytanie zwróci wyłącznie te faktury wystawione dla klienta, których suma będzie mniejsza niż 10:

  SELECT customerid
        ,invoiceid
        ,total
    FROM invoice JOIN (SELECT invoiceid
                             ,SUM(total) OVER (PARTITION BY customerid
                                                   ORDER BY invoiceid) AS invoice_sum
                         FROM invoice)
                 USING (invoiceid)
   WHERE invoice_sum < 10
ORDER BY customerid
   LIMIT 10;

CustomerId  InvoiceId  Total
----------  ---------  -----
         98         3.98
         121        3.96
         1          1.98
         99         3.98
         2          3.96
         24         5.94
         77         1.98
         100        3.96
         46         8.91
         78         1.98

Nie przejmuj się, jeśli to zapytanie będzie dla Ciebie zbyt skomplikowane. To nic dziwnego, używa ono wielu elementów składki SQL. Postaraj się przeanalizować je jeszcze raz. Spróbuj też samodzielnie eksperymentować. Zacznij od wywołania podzapytania i przeanalizowania jego wyników.

Dodatkowe materiały do nauki

Artykuł nie wyczerpuje tematu funkcji analitycznych. Zachęcam Cię do rzucenia okiem na dodatkowe materiały do nauki. Pamiętaj, że dokumentacja Twojego silnika baz danych jest niezastąpiona ;) i zawiera dużo bardziej szczegółowe informacje.

Podsumowanie

Po przeczytaniu tego artykułu wiesz już czym są funkcje analityczne. Wiesz czym takie funkcje różnią się od zwykłego grupowania. Wiesz czym są funkcje okna i jak ich używać. Po przerobieniu ćwiczeń możesz śmiało powiedzieć, że udało Ci się sprawdzić wiedzę w praktyce. Gratulacje ;), funkcje analityczne to jedne z bardziej zaawansowanych elementów składki SQL.

Mam nadzieję, że artykuł był dla Ciebie pomocny. Proszę podziel się nim ze swoimi znajomymi. Dzięki temu pozwolisz mi dotrzeć do nowych Czytelników, za co z góry dziękuję. Jeśli nie chcesz pominąć kolejnych artykułów dopisz się do samouczkowego newslettera i polub Samouczka Programisty na Facebooku.

Do następnego razu!

W wyjątkowych przypadkach partycją może być także cała tabela. Przeczytasz o tym w dalszej części artykułu. ↩
Właściwie to nie z całą tabelą, a relacją powstałą po filtrowaniu i grupowaniu. Także to zagadnienie opiszę dokładniej w dalszej części artykułu. ↩

Pobierz opracowania zadań z rozmów kwalifikacyjnych

Funkcje analityczne w SQL

Czym są funkcje analityczne w SQL

Pozostałe funkcje agregujące

Klauzula `PARTITION BY`

Kiedy obliczana jest wartość funkcji analitycznej

Czym jest okno

Ćwiczenia do samodzielnego wykonania

Sortowanie w funkcjach analitycznych

Partycje a sortowanie

Ćwiczenia do samodzielnego wykonania

Unikanie duplikacji – nazwane partycje

Funkcje okna

Okno typu `ROWS`

Okno typu `GROUPS`

Okno typu `RANGE`

Filtrowanie okna

Lista funkcji

Funkcje analityczne a klauzula `WHERE`

Dodatkowe materiały do nauki

Podsumowanie

Zostaw komentarz

Także może Ci się spodobać

Podzapytania SQL

Funkcje i grupowanie wierszy w SQL

Sortowanie, aliasy, ograniczanie wyników i zwracanie unikalnych wartości

Pobieranie danych z bazy – SELECT

Funkcje analityczne w SQL

Czym są funkcje analityczne w SQL

Pozostałe funkcje agregujące

Klauzula PARTITION BY

Kiedy obliczana jest wartość funkcji analitycznej

Czym jest okno

Ćwiczenia do samodzielnego wykonania

Sortowanie w funkcjach analitycznych

Partycje a sortowanie

Ćwiczenia do samodzielnego wykonania

Unikanie duplikacji – nazwane partycje

Funkcje okna

Okno typu ROWS

Okno typu GROUPS

Okno typu RANGE

Filtrowanie okna

Lista funkcji

Funkcje analityczne a klauzula WHERE

Dodatkowe materiały do nauki

Podsumowanie

Zostaw komentarz

Także może Ci się spodobać

Podzapytania SQL

Funkcje i grupowanie wierszy w SQL

Sortowanie, aliasy, ograniczanie wyników i zwracanie unikalnych wartości

Pobieranie danych z bazy – SELECT

Klauzula `PARTITION BY`

Okno typu `ROWS`

Okno typu `GROUPS`

Okno typu `RANGE`

Funkcje analityczne a klauzula `WHERE`