baihongyu.com
博客
关于我
Deep Learning回顾之LeNet、AlexNet、GoogLeNet、VGG、ResNet
CNN的发展史从深度学习的诞生到AI的崛起,CNN作为计算机视觉领域的核心技术,经历了无数次的演变与突破。本文将从LeNet到AlexNet、VGG、GoogLeNet、ResNet的发展历程,回顾CNN的技术革新与应用进展。LeNet:CNN的开山之作1985年,Rumelhart和Hinton等人提出了后向传播(BackPropagation,BP)算法,为神经网络的训练开辟了新途径。这一算法......
阅读量:
798 次
2023-04-05
风靡全网的H5究竟是什么?
H5技术:互联网发展的新引擎H5技术作为互联网领域的最新进展,近年来备受关注。本文将从多个维度深入解析H5的核心特征及其在应用场景中的表现。H5技术可追溯至HTML5标准的发布。这一技术标准的推出标志着互联网技术的重大突破。H5不仅继承了传统HTML的特性,更在功能上有了显著提升。其核心优势体现在多个方面:首先,H5技术支持丰富的应用场景。其免插件音视频、图像动画等功能,为开发者提供了更为便捷的工......
阅读量:
797 次
2023-04-05
python数据类型详解
Python数据类型与操作指南1.字符串字符串是计算机中最常用的数据类型之一,用于存储和处理文本信息。在Python中,字符串可以通过单引号、双引号或三引号来表示。单引号字符串str='helloworld'print(str)双引号字符串str="helloworld"print(str)三引号字符串str='''helloworld'''print(str)2.布尔类型布尔......
阅读量:
797 次
2023-04-05
颜色特征
颜色特征在图像检索中的应用是多种视觉特征中最为广泛使用的,主要原因在于颜色不仅能够有效地反映图像所包含的物体或场景,还具有较高的鲁棒性。与尺寸、方向、视角等因素密切相关的特征相比,颜色特征对图像的整体特征描述具有较强的适应性。然而,如何有效地提取和表达颜色特征并构建图像间的相似度模型,仍然是图像检索领域中需要深入探讨的问题。颜色直方图是图像检索系统中最为常用的颜色特征之一。这种特征描述了图像中不同......
阅读量:
797 次
2023-04-05
A Detailed Introduction to K-Nearest Neighbor (KNN) Algorithm
ADetailedIntroductiontoK-NearestNeighbor(KNN)AlgorithmKNearestNeighbor(KNN)isasimpleyetversatilealgorithmthathasfoundapplicationsinvariousfieldsrangingfromcomputervisiontobioinformatics.Despiteitsstra......
阅读量:
797 次
2023-04-05
推荐系统的应用案例剖析
推荐系统的应用案例剖析发表于:2016-01-0417:34阅读:1007次来源:阿里巴巴资深工程师评论:0条作者:贾双成推荐系统的应用案例摘要:本章将继续讲述推荐系统的应用案例。为了说明推荐系统的详细实施方案,本章首先详细介绍了一个音乐系统推荐的实施案例,之后为了让读者清晰大型推荐系统的原理,简要介绍一个淘宝周边兴趣点推荐的技术方案。音乐推荐音乐推荐系统是一个很好的说明推荐系统工作原理的例子。音......
阅读量:
797 次
2023-04-05
URL 收藏
MatthiasNießnerStanford2016项目实践在他的研究生阶段,MatthiasNießner专注于实时3D重建技术、视频交互操作以及非线性优化算法等多个前沿领域。以下是他的一些主要研究成果:实时3D重建技术随着微软Kinect等深度传感器的普及,实时捕捉和理解3D环境成为研究热点。Matthias开发了一种高效的实时3D重建方法,能够同时实现场景建模和定位。该方法特别适用于大规模......
阅读量:
797 次
2023-04-05
高动态范围(HDR)
高动态范围(High-DynamicRange,HDR)是一项在现代影像技术中广泛应用的技术,旨在解决传统摄像机在强光和阴影环境下的曝光不足问题。以下将从基础知识到实际应用全方面探讨HDR技术。HDR的定义与原理HDR技术通过多帧曝光组合成一张完整图像,弥补了传统摄像机在高亮区域和阴影区域的表现不足。传统摄像机通常只能捕捉到较为有限的亮度范围(如3:1),而HDR可以扩展这一范围,捕捉到高达100......
阅读量:
797 次
2023-04-05
眨眼检测
眨眼检测算法有多种方法,但每种方法都有其独特的优势和适用场景。以下是几种常见的眨眼检测方法及其工作原理:一:基于阀值的方法这种方法通过设置特定的阈值来判断眨眼状态。具体来说,在眼完全闭上时,图像会呈现出较高的阀值差异,从而更容易识别闭眼状态。这种方法简单易行,但在实际应用中,可能需要根据具体场景调整阀值。二:简单逻辑判断法这种方法主要依赖于对眼部区域的简单逻辑判断。例如,通过分析眼部区域的形状变化......
阅读量:
797 次
2023-04-05
人脸识别简史与近期进展
人脸识别简史与近期进展自古至今,人脸识别技术经历了从实验性研究到现实应用的漫长历程。本文将从技术发展的历史脉络、关键技术演变以及当前研究热点等方面,梳理人脸识别领域的发展轨迹。一、人脸识别的发展阶段人脸识别技术的发展可以划分为三个主要阶段:初期阶段(1950年代至1980年代)在这段时间,人脸识别主要被视为一种模式识别问题,研究者们主要关注人脸的几何特征。代表性的技术包括基于特征点提取的方法,如边......
阅读量:
797 次
2023-04-05
Windows 10四大版本官方对比:国人肯定专业版
Windows10的多个版本以不同的功能特性和定位为市场划分,这种划分方式也随着每一代的更新而不断调整。微软为Windows10推出了四大主要版本,各具特色,满足不同的用户需求。下面从核心功能和商业特性两个维度,对这四个版本进行全面对比。首先,在核心功能方面,所有四个版本——家庭版、专业版、企业版和教育版——基本上没有本质的区别。它们都包含了Windows10的核心体验,包括原有的功能升级、Cor......
阅读量:
797 次
2023-04-05
从Theano到Lasagne:基于Python的深度学习的框架和库
深度学习作为机器学习和人工智能领域的重要组成部分,通过堆叠多层的神经网络,试图从数据中提取更深层次的意义。近年来,深度神经网络在“DeepDreams”和谷歌研究的“Inceptionism”等领域展现出蓬勃生命力。本文将探讨几个基于Python的深度学习框架和库。TheanoTheano不仅是本文将要讨论的其他框架的基础库,更是一个强大的工具。它支持从简单的logistic回归到复杂的模型构建,......
阅读量:
797 次
2023-04-05
NFS服务器设置及mount命令挂载
NFS服务器的配置与客户端操作说明NFS服务器的配置NFS服务器的配置主要通过/etc/exports文件来完成。文件格式如下:<共享目录><客户端地址或主机名>(<权限参数>)以下是一些常见的权限参数:rw:支持读取和写入权限ro:仅支持读取权限no_root_squash:禁止root用户使用root权限root_squash:如果客户端用户是root,权限......
阅读量:
797 次
2023-04-05
Caffe 实践DeepID(人脸识别)
Caffe实践DeepID(人脸识别)近年来,人脸识别技术取得了长足的进步,DeepID系统的开发与优化正是这一领域的重要里程碑。在本项目中,我们基于Caffe框架构建了一个高效的DeepID系统,旨在通过深度学习技术实现精准的人脸识别。系统的核心模块包括特征提取网络和分类器,采用了多种经典网络架构来优化特征表达。我们对训练数据进行了细致的清洗和标注,确保数据质量,从而在模型训练中取得了较好的效果......
阅读量:
797 次
2023-04-05
从0开始学习GitHub系列之「Git 速成」
从0开始学习GitHub系列之「Git速成」作为一名开发者,版本控制工具Git是我们日常开发中不可或缺的工具。然而,很多开发者在面对Git时,往往会感到无从下手。为了帮助大家快速上手Git,我们将从最基础的概念和操作开始,逐步揭示Git的魅力。Git的基本概念Git不仅仅是一个版本控制工具,它更像是一个版本控制系统。简单来说,Git帮助我们记录代码的变化,这样当我们需要回溯到某个版本时,就可以轻松......
阅读量:
797 次
2023-04-05
鱼眼校正之类别3
图像校正是一项重要的图像处理技术,常用于提升低质量图片的视觉效果。本文将展示两张图片的校正效果,并从技术原理进行解释。原图显示了一张模糊不清的场景,细节难以辨认。通过对图像的增强处理,可以看到更多的建筑细节和背景信息。校正后的图片显然比原图清晰许多。校正结果图显示,图片的整体亮度和对比度得到了显著提升。通过去模糊和细节恢复技术,原本模糊的部分变得清晰可辨。图像的色彩平衡也得到了优化,使得整体画面更......
阅读量:
797 次
2023-04-05
adb shell 命令详解,android, adb logcat
AndroidADB命令详解Android开发中,AndroidDebugBridge(ADB)是连接移动设备与电脑的重要工具。通过ADB,可以对设备进行文件操作、应用安装卸载、系统管理等多种操作。本文将详细介绍ADB命令的使用方法。ADB命令基础ADB命令主要用于与Android设备或模拟器进行交互。以下是常用的ADB命令分类及使用方法:1.进入模拟器的Shell模式命令:adbshell说明:......
阅读量:
798 次
2023-04-05
代码解析深度学习系统编程模型:TensorFlow vs. CNTK
CNTK与TensorFlow:深度学习框架的对比分析作为微软开源的深度学习工具包,CNTK与TensorFlow作为当前机器学习领域的领先框架,凭借各自独特的特性,吸引了大量开发者。作为一名开发者,我在编程模型和训练流程上对两者进行了深入对比,希望能为读者提供有价值的参考。##卷积神经网络的构建在卷积神经网络(CNN)方面,TensorFlow和CNTK的构建流程有着高度的相似性。两者都采用脚本......
阅读量:
797 次
2023-04-05
ICTCLAS 汉语词性标注集
ICTCLAS汉语词性标注集ICTCLAS是一个汉语词性标注集,旨在为汉语词性提供标准化的标注规范和代码体系。本文将详细介绍该词性标注集的主要内容和标注规则。一、词性分类与标注规则形容词标注规则形容词在汉语中通常以"a"作为代码例如:"Ag"表示形容词性语素,形容词代码为"a",语素代码"g"前面加上"A&q......
阅读量:
797 次
2023-04-05
ICCV 2023 | 旷视研究院入选论文亮点解读,涵盖3D目标检测、图像匹配、光流、点云配准等...
近日,国际计算机视觉大会ICCV(InternationalConferenceonComputerVision)公布了2023年论文录用结果。本届会议共有8068篇投稿,接收率为26.8%。ICCV是全球计算机领域顶级的学术会议,每两年召开一次,ICCV2023将于今年10月在法国巴黎举行。旷视研究院14篇论文入选,涵盖纯视觉3D目标检测、多模态3D检测、图像匹配、光流估计、3D点云配准等领域。......
阅读量:
797 次
2023-04-05
上一页
下一页