- 古力努尔·艾尔肯;索帅红;哈妮克孜·伊拉洪;
语音情感分析作为人机交互核心技术,在智能服务、医疗监测等领域需求迫切。在当前中文语音情感分析研究中,模型对声学特征的挖掘深度不足、分类稳定性与泛化能力有待提升,一定程度上影响技术落地效果。针对上述挑战,利用Python构建了面向中文场景的语音情感分析系统。以CASIA中文语音数据集为基础,采用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients, MFCC)提取声学特征,传统机器学习支持向量机(Support Vector Machine, SVM)作为核心分类器,并引入随机森林算法作为对比验证。通过构建多决策树集成学习机制,降低模型方差,提升分类稳定性与泛化能力。基于卷积神经网络(Convolutional Neural Network, CNN)的特征提取框架,结合长短时记忆网络(Long Short-Term Memory, LSTM)的门控机制,捕捉语音序列的长时依赖关系,有效规避传统循环神经网络(Recurrent Neural Network, RNN)的梯度消失问题。通过设计CNN-LSTM混合模型,实现语音情感特征的层次化、深度挖掘与精准分类,涵盖语音信号预处理、特征提取、情感分类等核心环节的语音情感分析系统。
2026年01期 v.52;No.725 1-7页 [查看摘要][在线阅读][下载 1317K] [阅读次数:0 ] - 陈雪华;倪蕾;刘喆;郑美;
针对传统云平台运维监控系统存在的监控信息分散、无效告警冗余、误报率高,且难以支撑全局化运维决策的问题,在分析现有基于环状数据库(Round Robin Database, RRD)、Zabbix等技术的监控方案不足的基础上,对Prometheus与Grafana的技术适配性进行简要介绍,提出一种基于该技术组合的私有云监控系统及实现方法。系统通过“数据采集,数据存储,监控展示,告警执行”四大模块协同工作:数据采集模块采用接口与探针双轨制策略,结合跨网交互方案与接口限流突破机制,实现多网络环境下监控数据的全面获取;数据存储模块构建“逻辑组织、分片存储、联邦聚合” 3层架构,基于Prometheus时序数据库与标签扩展模型,解决多源异构数据的高效存储与查询问题;告警执行模块引入动态阈值算法、分级抑制策略及告警风暴处理机制,提升告警准确性与可控性。通过搭建包含3台物理服务器的私有云测试集群,以Nagios系统为对照,对系统在正常负载、资源过载、网络隔离等场景下的性能进行仿真测试与对比分析。实验结果表明,与传统方案相比,该系统72h累计无效告警减少70.9%,告警准确率提升至92.2%(较对照组提高72.7%),平均告警延迟降低57.1%,同时CPU与内存资源占用分别减少6.8%和0.9 GB。研究结论显示,该系统可有效克服传统监控装置的缺陷,显著提升私有云平台的运行稳定性与运维效率,具备较强的工程实践推广价值。
2026年01期 v.52;No.725 8-18页 [查看摘要][在线阅读][下载 1633K] [阅读次数:0 ] - 郭威;赵星定;雷智华;
在航空领域,确保机载系统与地面设施之间高效、可靠的通信至关重要。探讨了一种基于ARINC841协议的媒介独立飞机消息传递机制(Media Independent Aircraft Messaging, MIAM),旨在实现空中与地面数据交换的优化。该机制的核心理念是将消息传递逻辑与底层通信技术相解耦,使得信息可以通过飞机通信寻址与报告系统(Aircraft Communications Addressing and Reporting System, ACARS)网络和互联网协议(Internet Protocol, IP)网络在空地间顺畅传输。详细介绍了MIMA、IP/ACARS传输链路的选择和切换机制、基于ACARS网络的报文交互流程、基于IP网络的报文交互流程。针对此空地报文机制,完成了系统设计和软件设计,并测试验证了可行性。
2026年01期 v.52;No.725 19-26页 [查看摘要][在线阅读][下载 2049K] [阅读次数:0 ] - 孙佳男;马茹;
在当前数字化转型与单位效能提升的背景下,为解决传统督查督办工作中存在的效率低下、信息滞后等问题,进一步提升部门执行力和公共服务质量,基于J2EE技术体系与B/S(Browser/Server)模式架构,在OA办公自动化平台上设计并实现了督查督办系统,通过全流程线上管理、可视化任务跟踪、智能提醒与自动统计等核心功能,实现了督查督办工作的信息化与智能化。应用结果表明,该系统显著提升了工作效率与信息透明度,有效强化了任务执行的监控力度,为部门协同与公共服务优化提供了可靠的信息化支撑。
2026年01期 v.52;No.725 27-32页 [查看摘要][在线阅读][下载 1341K] [阅读次数:0 ] - 陈晓光;
针对轻量级RepVGG模型中静态卷积核与单向特征传递的缺陷,提出动态多尺度特征增强网络——RepVGG-Dynamic。通过动态多分支卷积(Dynamic Multi-Branch Convolution, DMBC)融合多尺度空洞卷积分支,采用门控网络生成输入自适应权重,设计跨阶段特征融合(Cross Stage Feature Fusion, CSFF)的双向特征金字塔结构实现多层次特征交互,引入自适应动态激活(Adaptive Dynamic Activation, ADA)函数,基于特征统计量动态调节阈值与斜率。在Imagenette2-320与Oxford-102 Flowers数据集上的实验表明,所提模型以93.8%/93.3%Top-1精度超越MobileOne-S4(89.6%/93.2%)与RepVGG-A0(91.3%/92.2%),仅需9.12 M参数与1.61 G浮点运算数(Floating Point Operations, FLOPs)。消融实验进一步验证DMBC在Imagenette2-320上贡献最大独立增益(+1.4%),CSFF在Oxford-102 Flowers上展现最强细粒度提升(+0.7%),ADA在双数据集实现稳定增益(Imagenette2-320+0.3%,Oxford-102 Flowers+0.2%)。为边缘设备提供了动态感知与硬件效率的平衡解决方案。
2026年01期 v.52;No.725 33-39页 [查看摘要][在线阅读][下载 1417K] [阅读次数:0 ] - 封超;庞欢;刘子玄;
针对专用数字通信(Professional Digital Trunking, PDT)、任务关键型通信(Mission-Critical X,MCX)以及宽带集群通信(Broadband-Trunking Communication, B-TrunC)等不同制式集群系统在互联场景下面临的功能单一、时延偏高等影响使用体验的问题,提出了一种基于先进融合网络架构的集群融合核心网实现方案。该方案通过协议适配与媒体转换技术,实现了对多系统流程的统一调度与控制,有效解决了系统间在信令协议与媒体传输方面的兼容性难题。同时,引入本地冗余部署与异地容灾机制,显著提升了系统的可靠性与稳定性。通过与现有方案的对比分析,验证了该方案在功能扩展性、时延优化等方面的显著优势,从而有效提升了集群通信系统的整体用户体验。
2026年01期 v.52;No.725 40-47页 [查看摘要][在线阅读][下载 1781K] [阅读次数:0 ]
- 朱哲维;李杭;史旭阳;李珂;
在医学影像诊断领域,肺炎结节检测对于肺炎的早期诊断和治疗具有关键意义。然而,由于肺炎结节在医学影像中形态各异、特征细节不显著,同时影像采集过程易受设备参数、患者呼吸运动等因素干扰,导致现有的结节检测模型在检测精度和鲁棒性方面存在一定局限。为此,提出了一种改进的YOLOv10-SF模型用于肺炎结节检测。针对肺炎结节特征信息不明显和背景复杂的问题,构建C2f-Star-CBAM模块并引入C2f-FADC模块,不仅能增强网络自适应调整感受野的能力,还提高了多尺度目标检测性能。通过引入GFL-GIoU Loss损失函数,优化了分类和定位,显著提升了检测精度和鲁棒性。实验结果证明,YOLOv10-SF模型在LUNG16数据集上表现出良好的检测性能。与YOLOv10相比,改进后模型召回率从68.8%提升到75.8%,平均精度均值(mean Average Precision, mAP)@0.5从68.5%提升到76.0%,该模型可提高肺炎结节的早期检出率,为临床诊疗决策提供更可靠依据。
2026年01期 v.52;No.725 48-55页 [查看摘要][在线阅读][下载 1689K] [阅读次数:0 ] - 罗成娥;吴帅杰;严威;苏永红;
可逆数据隐藏(Reversible Data Hiding, RDH)算法需平衡鲁棒性与隐蔽性问题。提出一种通过计算嵌入图像块预测差值直方图熵(block_entropy)值实现水印信号自适应嵌入载体图像的技术。水印图像数据嵌入前先进行阿诺德猫映射变换(Arnold’s Cat Map Transformation, Arnold)加密预处理,嵌入过程对载体图像进行8×8分块处理并实施二维离散余弦变换(Discrete Cosine Transform, DCT),将水印信息动态植入DCT中频系数。以麦克马斯特大学图片库(McMaster University Image Library, McMaster)等图像数据集测试,载体图像峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)值在38.72 dB左右,归一化相关系数(Normalized Correlation, NC)值为1。经过噪声攻击、缩放攻击等典型攻击多轮测试,与传统算法和其他算法同场景相比,所提算法NC值仍接近1,数据优于其他算法和传统算法。简洁的算法逻辑能快速实现水印的嵌入和提取,效率优于其他复杂度较高的算法,在数据鲁棒性、隐蔽性、时效性、保密性上表现良好,具有较好的可行性和推广性。
2026年01期 v.52;No.725 56-62页 [查看摘要][在线阅读][下载 1064K] [阅读次数:0 ] - 许惠惠;
短句意图识别在智能客服、人机交互和语音助手等领域具有关键应用价值。传统方法主要依赖文本特征,往往忽视了语音、语调及语义等多模态信息,限制了模型在复杂实际场景中的识别精度与泛化能力。为此,提出一种基于多模态融合的短句意图识别方法,利用预训练模型分别对文本与语音数据进行深层特征提取,并通过动态注意力机制实现多模态信息的自适应加权融合。实验结果表明,所提方法在标准数据集和真实场景数据集上均显著超越现有方法,有效提升了意图识别的准确性与鲁棒性。
2026年01期 v.52;No.725 63-67页 [查看摘要][在线阅读][下载 975K] [阅读次数:0 ] - 王少赛;丁学文;贾岩龙;常宸;
结直肠息肉精确分割是结直肠癌早期筛查和辅助诊断的关键环节,但息肉与周围黏膜对比度低、尺寸跨度大且临床图像背景复杂,易受异常曝光、出血点等噪声干扰,导致微小息肉漏检和边界模糊。为提高复杂场景下的分割鲁棒性,构建基于DeepLabV3+的改进密集注意力DeepLab(Densely Attentive DeepLab, DenseAttn-DeepLab, DenseAttn-DeepLab)网络。该网络在编码器高层引入交叉密集注意力(Cross Dense Attention, CDA)模块,通过密集跨层连接与通道重标定机制实现多尺度语义与纹理特征的高效融合,并抑制背景噪声;在全局与局部特征分支中引入双向坐标注意力(Bidirectional Coordinate Attention, BiCA)模块,结合通道注意力与双向空间坐标编码以及多尺度空间卷积,强化目标位置感知,并提升对微小息肉及边缘细节的响应。基于Kvasir-SEG和CVC-ClinicDB数据集开展实验,DenseAttn-DeepLab在两数据集上的平均戴森系数(mean Dice coefficient, mDice)/平均交并比(mean Intersenction over Umion, mIOU)分别达到91.7%/87.2%和93.3%/91.4%,相较DeepLabV3+和UNet++等主流模型在精度与鲁棒性方面均取得提升。结果表明,该方法能够在保持较低参数量和计算量的前提下,有效抑制背景噪声、改善小目标漏检,并优化息肉边界分割,为结直肠息肉的计算机辅助诊断提供了一种具有应用潜力的分割方案。
2026年01期 v.52;No.725 68-75页 [查看摘要][在线阅读][下载 1240K] [阅读次数:0 ] - 冯玉颖;吴敬怡;王文鼎;
随着雾霾的日益严重,图像去雾的研究变得越来越重要。针对雾霾天气导致的图像降质、现有去雾算法难以兼顾去雾效果与细节保留问题,整合物理层面的暗通道先验去雾模型(HE模型)与对称对数图像处理(Symmetric Logarithmic Image Processing, SLIP)模型的技术优势,构建了一种适用于彩色图像的对称对数物理去雾(HE-SLIP Fusion-Based Color Image Dehazing, HESLIP)算法。HESLIP算法执行流程是根据物理模型对彩色图像去雾;运用SLIP模型对彩色图像的I分量开展变换操作;利用彩色图像S分量的非线性指数调整模型以实现雾天图像的清晰化。与已有的去雾算法相比,HESLIP算法达到了更好的去雾效果。为验证算法性能,对HESLIP算法与已有的去雾算法进行了对比仿真与主客观评价测试。测试结果表明,所提算法在标准差、对比度和平均梯度方面都明显优于现有算法。HESLIP算法不仅能实现高效的图像去雾,还能有效保留图像边缘等细节信息的完整性,为彩色雾天图像的清晰化处理提供了更优方案。
2026年01期 v.52;No.725 76-81页 [查看摘要][在线阅读][下载 1628K] [阅读次数:0 ]