Category: cspaper

  • 在电场下,通过有效质量近似,原子尺度定位 Kohn-Sham 波函数在SiO2/4H-SiC界面上,偏离包络函数。

    为了阐明SiO2/4H-SiC界面低通道电导的原因,利用密度泛函理论在施加电场下计算了 SiC导带最小处的波函数。我们发现,4H-SiC(0001)平板的波函数倾向于局限于靠近界面的立方体位点。重要的是,由于导电电子分布在距离界面(

  • 复合开放量子系统的绝热消除:海森堡表述和数值模拟

    本报告提出了一种数值方法,用于在经典计算机上模拟由几个开放量子子系统组成的开放量子系统。假设每个子系统都强烈地指数稳定向一些无相干自由子空间,稍微受到一些相干通道的影响,并且与其他子系统弱耦合。这种数值方法基于利用动力学的海森堡公式的原始渐近展开的一种扰动分析,无论是在连续时间还是离散时间中。它基于子系统的局部和名义耗散动力学的不变算子。证明了二阶展开可以通过只进行本地计算来计算,从而避免对整个希尔伯特空间进行全局计算。该算法特别适用于自治量子纠错方案的仿真,例如具有Schr\”odinger猫态的玻色子代码。这些二阶海森堡模拟已与完整的Schr\”odinger模拟和通过二阶绝热消除获得的解析公式进行了比较。这些比较已对三个猫量子比特门进行了执行:单猫量子比特上的Z门;两个猫量子比特上的ZZ门;三个猫量子比特上的ZZZ门。对于ZZZ门,当每个猫量子比特的能量$\alpha^2$超过8时,完整的Schr\”odinger模拟几乎是不可能的,而二阶海森堡模拟仍然容易达到机器精度。这些数值研究表明,二阶海森堡动力学捕捉了极小的比特翻转误差概率及其指数下降,其$\alpha^2$变化范围从1到16。它们还提供了对量子过程拓扑的直接数值访问,即所谓的$\chi$矩阵,它提供了不同误差通道及其概率的完整特征。 This report proposes a numerical method for simulating on a classical computer an open quantum system composed of several open quantum subsystems. Each subsystem is assumed to be strongly stabilized exponentially towards a decoherence free sub-space, slightly impacted by some decoherence channels and weakly coupled to the other subsystems. This numerical method is based […]

  • 通过自适应边缘提高视频检索

    由于网络上视频的迅速涌现,视频检索变得越来越重要。目前,主流的视频检索模式是通过将正样本与负样本相似性之间的距离与一个固定边界的距离扩大来学习视频-文本表示。然而,用于训练的负样本是随机采样的,这意味着负样本之间的语义可能相关甚至等同,而大多数方法仍然强制使它们之间的表示不相似以减少它们之间的相似性。这种现象导致了不准确的监督和在学习视频-文本表示时表现较差。 尽管大多数视频检索方法忽略了这种现象,但我们提出了一种自适应边界,它可以根据正负样本之间的距离变化来解决上述问题。首先,我们设计了自适应边界的计算框架,包括距离测量方法和距离与边界之间的函数。然后,我们探索了一种新颖的实现方法,称为“跨模态广义自我蒸馏”(CMGSD),它可以在大多数视频检索模型上进行少量修改。值得注意的是,在训练时,CMGSD几乎不增加计算成本,在测试时不增加计算成本。在三个广泛使用的数据集上的实验结果表明,所提出的方法可以比相应的骨干模型产生显着更好的性能,并且它的表现超过了最先进的方法。 Video retrieval is becoming increasingly important owing to the rapid emergence of videos on the Internet. The dominant paradigm for video retrieval learns video-text representations by pushing the distance between the similarity of positive pairs and that of negative pairs apart from a fixed margin. However, negative pairs used for training are sampled […]

  • 考虑到轨迹,用于多人姿态预测的身体相互作用转换器

    多人姿势预测仍然是一个具有挑战性的问题,特别是在模拟复杂人群场景中的人体细节交互方面。现有方法通常将整个姿态序列表示为时间序列,但忽略了基于骨架身体部位的人际交互影响。在本文中,我们提出了一种新颖的轨迹感知体部交互Transformer(TBIFormer)用于通过有效地建模身体部位交互来进行多人姿势预测。具体地,我们构建了一个时间身体分区模块,将所有姿态序列转换为多人身体部位序列,以根据身体语义保留空间和时间信息。然后,我们设计了一个社交身体交互自注意(SBI-MSA)模块,利用转换后的序列来学习身体部位动态的人际交互和个体内部交互。此外,与以往基于欧氏距离的空间编码不同,我们提出了一种新颖而高效的轨迹感知相对位置编码用于SBI-MSA,以提供有区别的空间信息和额外的交互线索。在短期和长期视野下,我们在CMU-Mocap、MuPoTS-3D以及合成数据集(6 ~ 10人)上进行了实证评估,并证明了我们的方法大大优于最先进的方法。代码将在接受后公开提供。 Multi-person pose forecasting remains a challenging problem, especially in modeling fine-grained human body interaction in complex crowd scenarios. Existing methods typically represent the whole pose sequence as a temporal series, yet overlook interactive influences among people based on skeletal body parts. In this paper, we propose a novel Trajectory-Aware Body Interaction Transformer […]

  • 量子增强的连续变量量子态学习

    高效地表征连续变量量子态对于量子通信、量子传感、量子模拟和量子计算非常重要。然而,传统的量子态重构和最近提出的经典影子重构需要对希尔伯特空间或相空间进行截断,导致所需样本复杂度随着模数的增加呈指数增长。本文提出了一种量子增强学习策略,用于克服此前的缺点。我们利用该策略来估计状态特征函数的点值,这对于量子态重构和推断量子保真度、非经典性和量子非高斯性等物理性质非常有用。我们证明,对于任何具有反射对称性的连续变量量子态$\rho$,例如零均值的高斯态、Fock态、Gottesman-Kitaev-Preskill态、Schrödinger猫态和二项式码态,在实际量子器件上,我们只需恒定数量的$\rho$副本即可精确地估计其特征函数在任意相空间点的平方。这可以通过在两个$\rho$副本上进行平衡分束器然后进行同步检测来实现。基于这个结果,我们还展示了,在给定非局域量子测量的情况下,对于任何具有反射对称性的$k$模连续变量态$\rho$,我们只需要$O(\log M)$个$\rho$副本即可在任意$M$个相空间点上准确估计其特征函数值。此外,副本数量与$k$无关。这可以与传统方法进行比较,该方法需要$\Omega(M)$个副本才能在$M$个任意相空间点上估计特征函数值。 Efficient characterization of continuous-variable quantum states is important for quantum communication, quantum sensing, quantum simulation and quantum computing. However, conventional quantum state tomography and recently proposed classical shadow tomography require truncation of the Hilbert space or phase space and the resulting sample complexity scales exponentially with the number of modes. In this paper, […]

  • 通过自动格式选择和机器学习优化稀疏线性代数

    稀疏矩阵是科学模拟的重要组成部分。随着硬件的发展,提出了新的稀疏矩阵存储格式,旨在利用特定于新硬件的优化。在异构计算时代,用户经常需要使用多个格式来保持其应用程序在不同可用硬件上的最优性,从而导致开发时间加长和维护开销增加。解决这个问题的一个潜在方法是使用由机器学习(Machine Learning,ML)驱动的轻量级自动调谐器,从可用格式池中选择适合稀疏性模式、目标硬件和操作的最佳格式,以便为用户选择。 本文介绍了Morpheus-Oracle,一个提供轻量级ML自动调谐器的库,能够准确预测多个后端的最优格式,目标是主要的HPC架构,旨在消除结束用户对格式选择的输入。通过对2000多个实际矩阵的测试,我们在可用系统中实现了92.63%的平均分类准确性和80.22%的平衡准确性。采用自动调谐器的平均加速比为1.1x(在CPU上)和1.5x到8x(在NVIDIA和AMD GPU上),最大加速比分别达到7x和1000x。 Sparse matrices are an integral part of scientific simulations. As hardware evolves new sparse matrix storage formats are proposed aiming to exploit optimizations specific to the new hardware. In the era of heterogeneous computing, users often are required to use multiple formats for their applications to remain optimal across the different […]

  • 可扩展的随机梯度黎曼 Langevin 动态在非对角度量中

    Bayesian神经网络推断通常使用随机梯度采样方法进行。为了获得最佳性能,这些方法应使用改进后验探索的Riemannian度量,通过考虑局部曲率,但现有的方法采用简单的对角度量以保持计算效率。这样会失去一些收益。我们提出了两种非对角度量,可以在随机采样器中使用,提高收敛和探索,但与对角度量相比,只有很小的计算开销。我们证明,对于复杂后验的神经网络,例如使用稀疏诱导先验,使用这些度量可以明显改善结果。对于其他一些选择,后验绰绰有余,即使使用简单的度量也足够。 Bayesian neural network inference is often carried out using stochastic gradient sampling methods. For best performance the methods should use a Riemannian metric that improves posterior exploration by accounting for the local curvature, but the existing methods resort to simple diagonal metrics to remain computationally efficient. This loses some of the gains. We propose […]

  • StyleDiff:潜在解缠空间中无标记数据集之间的属性比较

    机器学习应用中的一个主要挑战是应对开发中使用的数据集与实际应用中获得的数据集之间的不匹配。这些不匹配可能导致不准确的预测和错误,从而导致产品质量不佳和不可靠的系统。在本研究中,我们提出了StyleDiff,以便通知开发人员两个数据集之间的差异,从而稳步开发机器学习系统。使用最近提出的生成模型获取的分离图像空间,StyleDiff专注于图像中的属性比较这两个数据集,并提供了一个易于理解的分析。StyleDiff的提出在$O(dN\log N)$中运行,其中$N$为数据集的大小,$d$为属性数,可应用于大型数据集。我们证明了StyleDiff准确地检测到数据集之间的差异,并以易于理解的格式展示了它们,例如在驾驶场景数据集中。 One major challenge in machine learning applications is coping with mismatches between the datasets used in the development and those obtained in real-world applications. These mismatches may lead to inaccurate predictions and errors, resulting in poor product quality and unreliable systems. In this study, we propose StyleDiff to inform developers of the differences […]

  • 算法中立性

    偏见感染了掌控我们生活的算法。预测性执法系统高估了有色人种社区的犯罪率;招聘算法刻意排除了符合条件的女性候选人;面部识别软件难以识别深色皮肤的脸孔。算法偏见已经得到了相当大的关注。相比之下,算法中立性却得到了较少的关注。我研究的是算法中立性。我提出了三个问题:什么是算法中立性?算法中立性是否可能?在我们关注算法中立性时,我们可以从算法偏差中学到什么?为了以具体的方式回答这些问题,我选择了研究搜索引擎这个案例。参考科学中的中立性研究,我认为只有当搜索引擎排名网页时,诸如政治意识形态或搜索引擎运营商的财务利益等价值不起作用时,搜索引擎才是中立的。我认为,搜索中立是不可能的。它的不可能似乎威胁到搜索偏见的重要性:如果没有一个搜索引擎是中立的,那么每个搜索引擎都是有偏见的。为了化解这种威胁,我区分了两种偏见形式,自我失败的偏见和其他价值观的偏见。尽管中立性不可能实现,但这种区分使我们能够理解搜索偏见,并捕捉到其规范的色彩。 Bias infects the algorithms that wield increasing control over our lives. Predictive policing systems overestimate crime in communities of color; hiring algorithms dock qualified female candidates; and facial recognition software struggles to recognize dark-skinned faces. Algorithmic bias has received significant attention. Algorithmic neutrality, in contrast, has been largely neglected. Algorithmic neutrality is my topic. […]

  • MaskDiff:使用扩散概率模型建模口罩分布以进行少样本实例分割

    Few-shot instance segmentation 是将少样本学习范式扩展到实例分割任务,旨在利用极少数量的新类别样本来从查询图像中分割实例对象。传统方法通常通过原型学习、点估计来处理该任务。然而,这种机制容易受到噪声干扰,并且由于数据极度稀缺而存在偏差。为了克服点估计机制的缺点,我们提出了一种新的称为 MaskDiff 的方法,该方法建模了一个二值掩码的基础条件分布,该掩码在物体区域和 K 个样本信息的条件下。受到数据裁剪方法的启发,我们使用扩散概率模型建模掩码分布,从而扩展了数据密度低的区域。此外,我们也提出了无分类器引导掩码采样来将类别信息整合到二进制掩码生成过程中。我们的提出的方法相对于现有方法更为稳定,同时在 COCO 数据集的基类和新类上均始终表现出优异,且无需任何额外的操作。 Few-shot instance segmentation extends the few-shot learning paradigm to the instance segmentation task, which tries to segment instance objects from a query image with a few annotated examples of novel categories. Conventional approaches have attempted to address the task via prototype learning, known as point […]