共计 646 个字符,预计需要花费 2 分钟才能阅读完成。
train_test_split 函数是用来将数据集划分为训练集和测试集的。在 Python 中,train_test_split 函数可以通过 sklearn 库中的 model_selection 模块来使用。下面是一个简单的示例:
from sklearn.model_selection import train_test_split
import numpy as np
# 生成一些示例数据
X = np.array([[1, 2], [3, 4], [5, 6], [7, 8]])
y = np.array([0, 1, 0, 1])
# 将数据集划分为训练集和测试集,test_size 指定测试集比例,random_state 设置随机种子
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 打印划分后的训练集和测试集
print(" 训练集 X:", X_train)
print(" 测试集 X:", X_test)
print(" 训练集 y:", y_train)
print(" 测试集 y:", y_test)
在这个示例中,我们生成了一个包含 4 个样本的数据集 X 和对应的标签 y。然后使用 train_test_split 函数将数据集划分为训练集和测试集,其中 test_size 参数指定了测试集的比例(这里是 0.2,即 20%),random_state 参数设置了随机种子以确保划分结果的一致性。最后打印出划分后的训练集和测试集。
丸趣 TV 网 – 提供最优质的资源集合!
正文完