- opis :
To jest zestaw danych wykorzystany w Trzecim Międzynarodowym Konkursie Narzędzi do odkrywania wiedzy i eksploracji danych, który odbył się w połączeniu z KDD-99, Piątą Międzynarodową Konferencją na temat odkrywania wiedzy i eksploracji danych. Zadanie konkursowe polegało na zbudowaniu detektora włamań do sieci, modelu predykcyjnego zdolnego do rozróżniania „złych” połączeń, zwanych włamaniami lub atakami, od „dobrych” normalnych połączeń. Ta baza danych zawiera standardowy zestaw danych do audytu, który obejmuje szeroką gamę włamań symulowanych w wojskowym środowisku sieciowym.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
Kod źródłowy :
tfds.datasets.kddcup99.Builder
Wersje :
-
1.0.0
: Pierwsza wersja. -
1.0.1
(domyślnie): Naprawiono parsowanie pól boolowskichland
,logged_in
,root_shell
,is_hot_login
iis_guest_login
.
-
Rozmiar pliku do pobrania :
18.62 MiB
Rozmiar zestawu danych :
5.25 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Podział | Przykłady |
---|---|
'test' | 311 029 |
'train' | 4 898 431 |
- Struktura funkcji :
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształtować się | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
liczyć | Napinacz | int32 | ||
diff_srv_rate | Napinacz | pływak32 | ||
dst_bajty | Napinacz | int32 | ||
dst_liczba_hostów | Napinacz | int32 | ||
dst_host_diff_srv_rate | Napinacz | pływak32 | ||
dst_host_rerror_rate | Napinacz | pływak32 | ||
dst_host_same_src_port_rate | Napinacz | pływak32 | ||
dst_host_same_srv_rate | Napinacz | pływak32 | ||
dst_host_serror_rate | Napinacz | pływak32 | ||
dst_host_srv_count | Napinacz | int32 | ||
dst_host_srv_diff_host_rate | Napinacz | pływak32 | ||
dst_host_srv_rerror_rate | Napinacz | pływak32 | ||
dst_host_srv_serror_rate | Napinacz | pływak32 | ||
Trwanie | Napinacz | int32 | ||
flaga | Etykieta klasy | int64 | ||
gorący | Napinacz | int32 | ||
is_guest_login | Napinacz | bool | ||
is_hot_login | Napinacz | bool | ||
etykieta | Etykieta klasy | int64 | ||
grunt | Napinacz | bool | ||
Zalogowany | Napinacz | bool | ||
liczba_plików_dostępu | Napinacz | int32 | ||
num_naruszony | Napinacz | int32 | ||
num_failed_logins | Napinacz | int32 | ||
num_file_creations | Napinacz | int32 | ||
num_outbound_cmds | Napinacz | int32 | ||
num_root | Napinacz | int32 | ||
liczba_muszli | Napinacz | int32 | ||
typ_protokołu | Etykieta klasy | int64 | ||
wskaźnik_błędów | Napinacz | pływak32 | ||
root_shell | Napinacz | bool | ||
ta sama_srv_rate | Napinacz | pływak32 | ||
częstotliwość_serror | Napinacz | pływak32 | ||
usługa | Etykieta klasy | int64 | ||
źródło_bajtów | Napinacz | int32 | ||
liczba_srv | Napinacz | int32 | ||
srv_diff_host_rate | Napinacz | pływak32 | ||
srv_rerror_rate | Napinacz | pływak32 | ||
srv_serror_rate | Napinacz | pływak32 | ||
su_attempted | Napinacz | int32 | ||
pilne | Napinacz | int32 | ||
błędny_fragment | Napinacz | int32 |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}