Блокнот начинающего Python-кодера на Kaggle
Если вы только делаете первые шаги, то этот блокнот поможет быстро стартануть и начать принимать участие в соревнованиях на Kaggle, одновременно осваивая Python с нуля. Всё главное в одном файле. Это краткий, но ёмкий гид по Python для новичков, оформленный прямо в коде. Здесь основные конструкции языка, типы данных, работа с циклами и функциями, а также первый опыт взаимодействия с данными через pandas и numpy. Девиз блокнота: «Освоить быстро — использовать как справочник». Поехали.
Python
# Блокнот начинающего Python-кодера на Kaggle
# 1. Переменные и типы данных
# В Python не нужно объявлять тип переменной заранее.
a = 5 # int
b = 3.14 # float
c = "Привет" # str
d = True # bool
e = None # специальное значение (ничего)
print("Переменные:", a, b, c, d, e)
# Ожидаемый вывод: Переменные: 5 3.14 Привет True None
# 2. Основные операции
# Арифметика
x = 10 + 2 # сложение
y = 10 - 2 # вычитание
z = 10 * 2 # умножение
w = 10 / 3 # деление (всегда float)
v = 10 // 3 # целочисленное деление
r = 10 % 3 # остаток от деления
p = 2 ** 3 # возведение в степень
print("Операции:", x, y, z, w, v, r, p)
# Ожидаемый вывод: Операции: 12 8 20 3.333... 3 1 8
# 3. Условия if-elif-else
age = 18
if age < 18:
print("Мал")
elif age == 18:
print("Тебе 18")
else:
print("Взрослый")
# Ожидаемый вывод: Тебе 18
# 4. Циклы for и while
# Цикл for
for i in range(3):
print("i =", i)
# Ожидаемый вывод:
# i = 0
# i = 1
# i = 2
# Цикл while
count = 0
while count < 3:
print("count =", count)
count += 1
# Ожидаемый вывод:
# count = 0
# count = 1
# count = 2
# 5. Списки (list) - изменяемые коллекции
my_list = [1, 2, 3]
my_list.append(4) # добавляем элемент
my_list[0] = 10 # меняем первый элемент
print("Список:", my_list)
# Ожидаемый вывод: Список: [10, 2, 3, 4]
# 6. Кортежи (tuple) - неизменяемые коллекции
t = (1, 2, 3)
print("Кортеж:", t[1])
# Ожидаемый вывод: 2
# 7. Словари (dict) - хранят пары ключ-значение
person = {
"name": "Иван",
"age": 30
}
print("Имя:", person["name"])
# Ожидаемый вывод: Имя: Иван
# 8. Функции
def greet(name):
return f"Привет, {name}!"
print(greet("Алекс"))
# Ожидаемый вывод: Привет, Алекс!
# 9. Работа с библиотеками
# Часто используемые библиотеки на Kaggle:
import numpy as np
import pandas as pd
# Пример работы с pandas:
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35]
}
df = pd.DataFrame(data)
print("DataFrame:\n", df)
# Ожидаемый вывод:
# DataFrame:
# Name Age
# 0 Alice 25
# 1 Bob 30
# 2 Charlie 35
# 10. Чтение CSV файла (часто используется в задачах Kaggle)
# Пример:
# df_train = pd.read_csv('train.csv')
# print(df_train.head())
# 11. Основная структура Kaggle ноутбука
# Обычно выглядит так:
# Шаг 1: Импорты
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# Шаг 2: Загрузка данных
# train = pd.read_csv('../input/titanic/train.csv')
# Шаг 3: Анализ данных
# print(train.info())
# print(train.describe())
# Шаг 4: Предобработка
# train['Age'] = train['Age'].fillna(train['Age'].mean())
# Шаг 5: Модель
# from sklearn.ensemble import RandomForestClassifier
# Шаг 6: Сохранение результата
# submission.to_csv('submission.csv', index=False)
# 12. Полезные советы:
# - Ctrl+Enter — выполнить ячейку
# - Shift+Tab — подсказка по функции
# - '?' перед функцией — документация (например: ?pd.read_csv)
# - Чтобы узнать тип объекта: type(obj)
# - Чтобы узнать содержимое: dir(obj)
# Удачи на Kaggle!