正如elham所提到的,您可以使用scikit-learn轻松完成此操作。 scikit-learn是一个用于机器学习的开源库。有大量的数据准备工具,包括model_selection
模块,该模块处理比较,验证和选择参数。
model_selection.train_test_split()
方法经过专门设计,可将您的数据随机且按百分比分为训练集和测试集。
X_train, X_test, y_train, y_test = train_test_split(features,
labels,
test_size=0.33,
random_state=42)
test_size
是保留用于测试的百分比, random_state
是播种随机采样的种子。
我通常使用它来提供训练和验证数据集,并分别保存真实的测试数据。您也可以只运行两次train_test_split
来执行此操作。即将数据分为(训练+验证)和测试,然后将训练+验证分为两个单独的张量。
0
假设我已经使用
TextLineReader
读取了文本文件。有没有办法在Tensorflow
其拆分为训练集和测试集?就像是: