- opis :
RL Unplugged to zestaw testów porównawczych do uczenia się ze wzmacnianiem w trybie offline. RL Unplugged został zaprojektowany z myślą o następujących kwestiach: aby ułatwić użytkowanie, zapewniamy zestawy danych z ujednoliconym interfejsem API, który ułatwia praktykowi pracę ze wszystkimi danymi w pakiecie po ustaleniu ogólnego potoku.
Zestawy danych są zgodne z formatem RLDS, aby reprezentować kroki i epizody.
Przykłady w zbiorze danych przedstawiają przejścia SAR przechowywane podczas uruchamiania agenta częściowo przeszkolonego online, jak opisano w https://arxiv.org/abs/1904.12901 Przestrzegamy formatu zestawu danych RLDS, jak określono w https://github.com/google-research /rlds#format zestawu danych
Publikujemy łącznie 40 zestawów danych dotyczących 8 zadań — bez połączonych wyzwań i łatwych połączonych wyzwań dotyczących zadań z masztem, chodzika, czworonogów i humanoidów. Każde zadanie zawiera 5 różnych rozmiarów zestawów danych, 1%, 5%, 20%, 40% i 100%. Należy zauważyć, że mniejszy zbiór danych nie gwarantuje, że będzie podzbiorem większych. Aby uzyskać szczegółowe informacje na temat sposobu wygenerowania zestawu danych, zapoznaj się z artykułem.
Strona główna : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
Kod źródłowy :
tfds.rl_unplugged.rlu_rwrl.RluRwrl
Wersje :
-
1.0.0
: Pierwsza wersja. -
1.0.1
(domyślnie): naprawia błąd w zbiorze danych RLU RWRL polegający na tym, że w jednym z humanoidalnych zestawów danych występują zduplikowane identyfikatory odcinków.
-
Rozmiar pliku do pobrania :
Unknown size
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@misc{gulcehre2020rl,
title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
and Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
year={2020},
eprint={2006.13888},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (domyślna konfiguracja)
Rozmiar zbioru danych :
172.43 KiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 5 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (1,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/pozycja | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (2,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent
Rozmiar zbioru danych :
862.13 KiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 25 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (1,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/pozycja | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (2,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent
Rozmiar zestawu danych :
3.37 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 100 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (1,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/pozycja | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (2,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent
Rozmiar zestawu danych :
6.74 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 200 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (1,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/pozycja | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (2,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent
Rozmiar zestawu danych :
16.84 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 500 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (1,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/pozycja | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (2,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent
Rozmiar zestawu danych :
1.77 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 5 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (12,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/stan_egocentryczny | Napinacz | (44,) | pływak32 | |
kroki/obserwacja/siła_moment obrotowy | Napinacz | (24,) | pływak32 | |
kroki/obserwacja/imu | Napinacz | (6,) | pływak32 | |
kroki/obserwacja/torso_upright | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/torso_velocity | Napinacz | (3,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent
Rozmiar zestawu danych :
8.86 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 25 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (12,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/stan_egocentryczny | Napinacz | (44,) | pływak32 | |
kroki/obserwacja/siła_moment obrotowy | Napinacz | (24,) | pływak32 | |
kroki/obserwacja/imu | Napinacz | (6,) | pływak32 | |
kroki/obserwacja/torso_upright | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/torso_velocity | Napinacz | (3,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent
Rozmiar zestawu danych :
35.46 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 100 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (12,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/stan_egocentryczny | Napinacz | (44,) | pływak32 | |
kroki/obserwacja/siła_moment obrotowy | Napinacz | (24,) | pływak32 | |
kroki/obserwacja/imu | Napinacz | (6,) | pływak32 | |
kroki/obserwacja/torso_upright | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/torso_velocity | Napinacz | (3,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent
Rozmiar zestawu danych :
70.92 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 200 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (12,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/stan_egocentryczny | Napinacz | (44,) | pływak32 | |
kroki/obserwacja/siła_moment obrotowy | Napinacz | (24,) | pływak32 | |
kroki/obserwacja/imu | Napinacz | (6,) | pływak32 | |
kroki/obserwacja/torso_upright | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/torso_velocity | Napinacz | (3,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent
Rozmiar zestawu danych :
177.29 MiB
Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy
shuffle_files=False
(pociąg)Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 500 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (12,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/stan_egocentryczny | Napinacz | (44,) | pływak32 | |
kroki/obserwacja/siła_moment obrotowy | Napinacz | (24,) | pływak32 | |
kroki/obserwacja/imu | Napinacz | (6,) | pływak32 | |
kroki/obserwacja/torso_upright | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/torso_velocity | Napinacz | (3,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_1_percent
Rozmiar zestawu danych :
6.27 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 50 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (6,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/wysokość | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kierunki | Napinacz | (14,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (9,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_5_percent
Rozmiar zestawu danych :
31.34 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 250 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (6,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/wysokość | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kierunki | Napinacz | (14,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (9,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_20_percent
Rozmiar zestawu danych :
125.37 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 1000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (6,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/wysokość | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kierunki | Napinacz | (14,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (9,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_40_percent
Rozmiar zestawu danych :
250.75 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 2000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (6,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/wysokość | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kierunki | Napinacz | (14,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (9,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_100_percent
Rozmiar zestawu danych :
626.86 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 5000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (6,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/wysokość | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kierunki | Napinacz | (14,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (9,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent
Rozmiar zestawu danych :
69.40 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 200 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (21,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/com_velocity | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/kończyny | Napinacz | (12,) | pływak32 | |
kroki/obserwacja/wysokość_głowy | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kąty_wspólne | Napinacz | (21,) | pływak32 | |
kroki/obserwacja/torso_vertical | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (27,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent
Rozmiar zestawu danych :
346.98 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 1000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (21,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/com_velocity | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/kończyny | Napinacz | (12,) | pływak32 | |
kroki/obserwacja/wysokość_głowy | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kąty_wspólne | Napinacz | (21,) | pływak32 | |
kroki/obserwacja/torso_vertical | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (27,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent
Rozmiar zestawu danych :
1.36 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 4000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (21,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/com_velocity | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/kończyny | Napinacz | (12,) | pływak32 | |
kroki/obserwacja/wysokość_głowy | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kąty_wspólne | Napinacz | (21,) | pływak32 | |
kroki/obserwacja/torso_vertical | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (27,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent
Rozmiar zestawu danych :
2.71 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 8000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (21,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/com_velocity | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/kończyny | Napinacz | (12,) | pływak32 | |
kroki/obserwacja/wysokość_głowy | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kąty_wspólne | Napinacz | (21,) | pływak32 | |
kroki/obserwacja/torso_vertical | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (27,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent
Rozmiar zestawu danych :
6.78 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 20 000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (21,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/com_velocity | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/kończyny | Napinacz | (12,) | pływak32 | |
kroki/obserwacja/wysokość_głowy | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kąty_wspólne | Napinacz | (21,) | pływak32 | |
kroki/obserwacja/torso_vertical | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (27,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent
Rozmiar zbioru danych :
369.84 KiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 5 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (1,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/pozycja | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (2,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent
Rozmiar zestawu danych :
1.81 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 25 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (1,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/pozycja | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (2,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent
Rozmiar zestawu danych :
7.22 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 100 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (1,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/pozycja | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (2,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent
Rozmiar zestawu danych :
14.45 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 200 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (1,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/pozycja | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (2,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent
Rozmiar zestawu danych :
36.12 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 500 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (1,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/pozycja | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (2,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent
Rozmiar zestawu danych :
1.97 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 5 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (12,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/stan_egocentryczny | Napinacz | (44,) | pływak32 | |
kroki/obserwacja/siła_moment obrotowy | Napinacz | (24,) | pływak32 | |
kroki/obserwacja/imu | Napinacz | (6,) | pływak32 | |
kroki/obserwacja/torso_upright | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/torso_velocity | Napinacz | (3,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent
Rozmiar zestawu danych :
9.83 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 25 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (12,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/stan_egocentryczny | Napinacz | (44,) | pływak32 | |
kroki/obserwacja/siła_moment obrotowy | Napinacz | (24,) | pływak32 | |
kroki/obserwacja/imu | Napinacz | (6,) | pływak32 | |
kroki/obserwacja/torso_upright | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/torso_velocity | Napinacz | (3,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent
Rozmiar zestawu danych :
39.31 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 100 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (12,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/stan_egocentryczny | Napinacz | (44,) | pływak32 | |
kroki/obserwacja/siła_moment obrotowy | Napinacz | (24,) | pływak32 | |
kroki/obserwacja/imu | Napinacz | (6,) | pływak32 | |
kroki/obserwacja/torso_upright | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/torso_velocity | Napinacz | (3,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent
Rozmiar zestawu danych :
78.63 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 200 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (12,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/stan_egocentryczny | Napinacz | (44,) | pływak32 | |
kroki/obserwacja/siła_moment obrotowy | Napinacz | (24,) | pływak32 | |
kroki/obserwacja/imu | Napinacz | (6,) | pływak32 | |
kroki/obserwacja/torso_upright | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/torso_velocity | Napinacz | (3,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent
Rozmiar zestawu danych :
196.57 MiB
Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy
shuffle_files=False
(pociąg)Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 500 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (12,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/stan_egocentryczny | Napinacz | (44,) | pływak32 | |
kroki/obserwacja/siła_moment obrotowy | Napinacz | (24,) | pływak32 | |
kroki/obserwacja/imu | Napinacz | (6,) | pływak32 | |
kroki/obserwacja/torso_upright | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/torso_velocity | Napinacz | (3,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_1_percent
Rozmiar zestawu danych :
8.20 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 50 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (6,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/wysokość | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kierunki | Napinacz | (14,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (9,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_5_percent
Rozmiar zestawu danych :
40.98 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 250 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (6,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/wysokość | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kierunki | Napinacz | (14,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (9,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_20_percent
Rozmiar zestawu danych :
163.93 MiB
Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy
shuffle_files=False
(pociąg)Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 1000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (6,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/wysokość | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kierunki | Napinacz | (14,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (9,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_40_percent
Rozmiar zestawu danych :
327.86 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 2000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (6,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/wysokość | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kierunki | Napinacz | (14,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (9,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_100_percent
Rozmiar zestawu danych :
819.65 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 5000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (6,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/wysokość | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kierunki | Napinacz | (14,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (9,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent
Rozmiar zbioru danych :
77.11 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 200 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (21,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/com_velocity | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kończyny | Napinacz | (12,) | pływak32 | |
kroki/obserwacja/wysokość_głowy | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kąty_wspólne | Napinacz | (21,) | pływak32 | |
kroki/obserwacja/torso_vertical | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (27,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent
Rozmiar zbioru danych :
385.54 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 1000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (21,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/com_velocity | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kończyny | Napinacz | (12,) | pływak32 | |
kroki/obserwacja/wysokość_głowy | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kąty_wspólne | Napinacz | (21,) | pływak32 | |
kroki/obserwacja/torso_vertical | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (27,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent
Rozmiar zestawu danych :
1.51 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 4000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (21,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/com_velocity | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kończyny | Napinacz | (12,) | pływak32 | |
kroki/obserwacja/wysokość_głowy | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kąty_wspólne | Napinacz | (21,) | pływak32 | |
kroki/obserwacja/torso_vertical | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (27,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent
Rozmiar zestawu danych :
3.01 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 8000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (21,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/com_velocity | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kończyny | Napinacz | (12,) | pływak32 | |
kroki/obserwacja/wysokość_głowy | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kąty_wspólne | Napinacz | (21,) | pływak32 | |
kroki/obserwacja/torso_vertical | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (27,) | pływak32 | |
kroki/nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent
Rozmiar zestawu danych :
7.53 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 20 000 |
- Struktura funkcji :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odcinek_powrót | Napinacz | pływak32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (21,) | pływak32 | |
kroki/rabat | Napinacz | (1,) | pływak32 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/com_velocity | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/manekin-0 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-1 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-2 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-3 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-4 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-5 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-6 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-7 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-8 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/manekin-9 | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kończyny | Napinacz | (12,) | pływak32 | |
kroki/obserwacja/wysokość_głowy | Napinacz | (1,) | pływak32 | |
kroki/obserwacja/kąty_wspólne | Napinacz | (21,) | pływak32 | |
kroki/obserwacja/torso_vertical | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/prędkość | Napinacz | (27,) | pływak32 | |
kroki / nagroda | Napinacz | (1,) | pływak32 |
- Przykłady ( tfds.as_dataframe ):