Новости IT, Tech-лайфхаки & Кодинг

Блокнот начинающего Python-кодера на Kaggle

Если вы только делаете первые шаги, то этот блокнот поможет быстро стартануть и начать принимать участие в соревнованиях на Kaggle, одновременно осваивая Python с нуля. Всё главное в одном файле. Это краткий, но ёмкий гид по Python для новичков, оформленный прямо в коде. Здесь основные конструкции языка, типы данных, работа с циклами и функциями, а также первый опыт взаимодействия с данными через pandas и numpy. Девиз блокнота: «Освоить быстро — использовать как справочник». Поехали.


Python
# Блокнот начинающего Python-кодера на Kaggle

# 1. Переменные и типы данных
# В Python не нужно объявлять тип переменной заранее.
a = 5               # int
b = 3.14            # float
c = "Привет"        # str
d = True            # bool
e = None            # специальное значение (ничего)

print("Переменные:", a, b, c, d, e)
# Ожидаемый вывод: Переменные: 5 3.14 Привет True None

# 2. Основные операции
# Арифметика
x = 10 + 2      # сложение
y = 10 - 2      # вычитание
z = 10 * 2      # умножение
w = 10 / 3      # деление (всегда float)
v = 10 // 3     # целочисленное деление
r = 10 % 3      # остаток от деления
p = 2 ** 3      # возведение в степень

print("Операции:", x, y, z, w, v, r, p)
# Ожидаемый вывод: Операции: 12 8 20 3.333... 3 1 8

# 3. Условия if-elif-else
age = 18
if age < 18:
    print("Мал")
elif age == 18:
    print("Тебе 18")
else:
    print("Взрослый")
# Ожидаемый вывод: Тебе 18

# 4. Циклы for и while
# Цикл for
for i in range(3):
    print("i =", i)
# Ожидаемый вывод:
# i = 0
# i = 1
# i = 2

# Цикл while
count = 0
while count < 3:
    print("count =", count)
    count += 1
# Ожидаемый вывод:
# count = 0
# count = 1
# count = 2

# 5. Списки (list) - изменяемые коллекции
my_list = [1, 2, 3]
my_list.append(4)       # добавляем элемент
my_list[0] = 10         # меняем первый элемент

print("Список:", my_list)
# Ожидаемый вывод: Список: [10, 2, 3, 4]

# 6. Кортежи (tuple) - неизменяемые коллекции
t = (1, 2, 3)
print("Кортеж:", t[1])
# Ожидаемый вывод: 2

# 7. Словари (dict) - хранят пары ключ-значение
person = {
    "name": "Иван",
    "age": 30
}
print("Имя:", person["name"])
# Ожидаемый вывод: Имя: Иван

# 8. Функции
def greet(name):
    return f"Привет, {name}!"

print(greet("Алекс"))
# Ожидаемый вывод: Привет, Алекс!

# 9. Работа с библиотеками
# Часто используемые библиотеки на Kaggle:

import numpy as np
import pandas as pd

# Пример работы с pandas:
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35]
}
df = pd.DataFrame(data)
print("DataFrame:\n", df)
# Ожидаемый вывод:
# DataFrame:
#      Name  Age
# 0   Alice   25
# 1     Bob   30
# 2  Charlie  35

# 10. Чтение CSV файла (часто используется в задачах Kaggle)
# Пример:
# df_train = pd.read_csv('train.csv')
# print(df_train.head())

# 11. Основная структура Kaggle ноутбука
# Обычно выглядит так:

# Шаг 1: Импорты
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Шаг 2: Загрузка данных
# train = pd.read_csv('../input/titanic/train.csv')

# Шаг 3: Анализ данных
# print(train.info())
# print(train.describe())

# Шаг 4: Предобработка
# train['Age'] = train['Age'].fillna(train['Age'].mean())

# Шаг 5: Модель
# from sklearn.ensemble import RandomForestClassifier

# Шаг 6: Сохранение результата
# submission.to_csv('submission.csv', index=False)

# 12. Полезные советы:
# - Ctrl+Enter — выполнить ячейку
# - Shift+Tab — подсказка по функции
# - '?' перед функцией — документация (например: ?pd.read_csv)
# - Чтобы узнать тип объекта: type(obj)
# - Чтобы узнать содержимое: dir(obj)

# Удачи на Kaggle!