金融文本分类模型的预测准确率
金融文本分类模型的预测准确率是衡量模型性能的重要指标。以下是根据搜索结果得出的一些相关信息:
中国银行股份有限公司取得的一项名为“分类模型预测方法及装置”的专利,该方法包括获取待预测分类模型和待预测分类模型对应的所有分类结果,从网络中抓取数据集,数据集包括每个分类结果各自相关的多个样本数据,从数据集包含的各个样本数据中确定多个目标样本数据,依据待预测分类模型和每个目标样本数据,调用预设的接口函数,得到待预测分类模型对应的日志数据集,获取预设的多个模型指标,并依据日志数据集,计算每个模型指标各自对应的指标值。这项专利的技术方案用于分类模型预测的数据为通过网络爬取得到的样本数据,而不是训练数据,从而避免了过拟合现象,且基于多个模型指标实现对分类模型预测,从而确保分类模型的准确性和最优性。
腾讯科技(深圳)有限公司取得的一项名为“文本分类方法、装置、计算机设备和存储介质”的专利,该方法包括获取待分类文本;将待分类文本输入已训练的分类速度导向的第一文本分类模型,得到第一文本分类结果;根据第一文本分类结果,确定待分类文本的文本类型,文本类型包括低复杂度文本和高复杂度文本;当文本类型为低复杂度文本时,根据第一文本分类结果得到目标文本分类结果;当文本类型为高复杂度文本时,将待分类文本输入已训练的分类精度导向的第二文本分类模型,得到第二文本分类结果,根据第二文本分类结果得到目标文本分类结果。采用本方法能够达到提升文本分类效率的目的,同时也保证了分类准确度。
一种基于金融文本情感分析的股票指数预测新方法,提出了一种基于金融文本情感分析的指数预测模型SABERTLSTM,对沪深300指数的涨跌进行预测。情感分析特征能够有效提高模型预测的准确率;相比三种对照模型(BP神经网络、支持向量机、XGBoost),SABERTLSTM模型预测精度更高;该模型同样适用于个股价格预测。
针对基于词袋的机器学习文本分类方法所存在的高维度、高稀疏性、不能识别同义词、语义信息缺失等问题,和基于规则模式的文本分类所存在的虽然准确率较高但鲁棒性较差的问题,提出了一种采用词汇—语义规则模式从金融新闻文本中提取事件语义标注信息,并将其作为分类特征用于机器学习文本分类中的新方法。
瞰点科技与华师大共同发布GraphSEAT,采用预训练语言模型的文本分类算法难以区分细粒度的语义信息,尚无法在金融量化投资领域获得成功应用。该方法采用针对目标任务的全局和模块信息编码融合的思想,有效地提升了针对金融领域的细粒度文本分类精度。
在“基于BERT与模型融合的短文本分类方法”中,评价指标包括宏观准确率(MacroPrecision)、宏观召回率(MacroRecall)、AverageF1值。最终排名以AverageF1值为基准。
在“Logistic回归,分类模型的性能评价指标”中,评价指标计算可对每个样本施加权重,权重通过参数sample_weight指定。分类模型的评价指标包括逻辑/负log似然损失(log_loss)、01损失(zero_one_loss)、合页损失(hinge_loss)、正确率(accuracy_score)、混淆矩阵(confusion_matrix)、精确率(precision)、召回率(recall)、F1分数(F1_score)等。
以上信息表明,金融文本分类模型的预测准确率可以通过多种方法和技术来提高,例如使用多种模型指标、提取事件语义标注信息、采用针对目标任务的全局和模块信息编码融合的思想等。同时,评估指标的选择也会影响模型的预测准确率,因此在选择评估指标时需要根据具体的应用场景和需求来进行。