N维重构
(一堂之见/陈树铭)
本文旨在撇开各种专业的限制,经过高度抽象,从问题最本质方面讨论一些问题,而望大家指点。
一、什么是N维重构问题
我们常听到各种各样的术语,比如科学数值计算领域的建模、遥感领域的图像判别、侦探领域的指纹识别、医学影像领域的图像分割、地质领域的三维地质重构、数值分析领域的各种插值分析、甚至统计分析与模糊分析等等,但不管这些领域多么的千差万别、术语多么的不同,事实上它们之间是有内在联系的,从某种意义上说,这种联系就是统一在N维重构这个概念上。下面这可能是一个不成熟的概念:
N维重构:就是对某一N维空间,从其局部的、或映射的信息出发,来对建立对整个待分析空间的整体描述的全过程。
可以说, N维重构问题是应用、分析、解决各种复杂问题的最后一把利剑。对于各种复杂问题,我们想完全解剖这个黑匣子是不可能,但是我们总是可以从这个黑匣子中了解到尽可能多的局部信息和相关的映射信息,因此,有了N维重构这把利剑,就可以得到解答,从而也就认识了黑匣子。
二、N维重构问题分类
N维重构问题,从重构信息与被重构信息之间的关系可以分为三大类:局部向整体重构、映射重构,混合重构。当然从其它角度也可以进行各种分类,但是此种分类更有利于解决方案的归类。
A、局部向整体重构
其特点是: 其一,局部信息与待分析的整体信息是同一类信息;
其二,局部信息是已知的,且确定的,要求分析的整体是未知的、不确定的;
其三,已知局部信息与待求整体信息之间是一种多维时空上,局部与整体的关系。
这类重构问题非常典型,贯穿在很多的社会生产实践中,比较典型的问题有:
1、地质三维分析领域。如根据很多已知钻孔的参数和属性,来分析整个区域的参数和属性。
2、土壤四维分析领域。如根据不同时间点、不同测点在一定深度范围内某种待分析物质的分布及其含量等,来分析整个区间该物质的分布及其含量。
3、四维地下水分析领域。地下水空间运动与分布同样是一个随时间和空间变化的局部向整体的重构问题。
4、四维地温场分析领域。如同样可以根据待分析场区已知钻井的温度变化,来分析整个场区随时间和空间变化的温度。
5、海洋分析领域。如海洋中随时间和空间变化的各种海水所含各种物质的浓度分布、扩散等。
6、气象分析领域。如根据各局部探测参数来分析某个区域的气候变化等。。
7、此外各种插值分析都是基于基于局部向整体的重构分析,如从等高线、离散点进行三维DEM曲面插值等。
这类重构所涉及的数据,也有学者称之为硬数据。
B、映射重构
其特点是:其一,已知信息是对待分析对象的一种全范围上的描述;
其二,这种被描述出的信息与待求所要表达的信息是一种多对多的复杂映射关系,也就是说已知的映射信息相对待求信息而言,是不确定的;
其三,从信息所涉及的范围上看,已知信息与待求信息是均等的。
几类重构问题也非常典型:
1、遥感信息处理。遥感信息是通过光学仪器对地面或地质进行光学信息处理来获取的信息。显然,这种信息是对被分析的某种属性的一种多对一的映射关系,因此结果往往只能是定性的。
2、三维医学影像数据分析。医学领域一般称之为图像分割,但本质上仍属于重构范畴,因为医学重构就是要根据各种影像图形重构出各个器官的空间形状和相互关系。
3、地质雷达分析。地质雷达就是通过测试瑞雷波来映射地质体的变化来反演地质体的空间分布。
这类重构所涉及的数据,有学者称之为软数据。
C、混合重构
混合重构是指同时涉及到局部重构和映射重构的耦合重构问题。即已知的信息中,既有已知确定性的局部信息,又不确定性的局部映射信息。
事实上,绝大多数的重构问题,从完整上讲都是一个耦合问题。在很多重构分析,既涉足到确定性的硬信息,又涉足到不确定性的软信息;此外,得到硬信息或软信息又有可能是局部的。因此,绝大多数领域的重构分析应该属于耦合分析。
混合重构问题大致可以归纳为两类:第一类问题是,待分析问题只存在很多局部的映射信息,即在某一个子区间上,是映射重构问题,但在整体上看,这又是一个局部的映射重构问题;第二类问题是,待分析问题不仅仅包括局部的已知信息,而且也包括映射信息,这种映射信息既可能是局部上,也可能是整体上的。
三、N维重构的核心问题
如何完整、准确的重构出被重构对象,涉及到很多方面的问题,比如说专业背景、重构算法等。应该说专业问题还是比较好解决的,从实现算法上讲,重构问题可以归纳为三个核心,其一是不同信息的权(可信度)问题,其二是整个分析区间的相关性问题,其三是待分析区间任一点存在多解问题(解的几率问题)。
A、权问题
权的问题是贯穿于整个重构分析的始终。通俗的讲,权就是每个已知点信息量对任何待求点属性值确定的影响程度。待求点的解在某种意义上就是各种相关已知信息,通过与某种权的积,所计算得出的。权反映了各已知信息点的可信程度。权的确定是复杂的,既要体现已知点自己的份量,又要反映整体空间的协调性。
B、相关性问题
之所以可以进行重构,是信息之间存在某种相关性,如果不存在任何信息之间相关性,则进行重构是不可能的,尽管可能这种相关性是模糊的、不确定的。对相关性的描述,目前从算法上有三类方法进行描述。
1、从统计学的协方差角度来考虑这种相关性。比如Kriging算法就是一个典型。
2、从模糊测度上来反映其相关性。从本质来讲,模糊测度是对相关性的一种最佳反映。因为从某种角度看,这种相关性总是可以抽象为不同 对象体在同一属性上的比较程度,或者是接近程度。事实上这也是模糊理论的本质。从我的实践看,模糊测度比统计学中的协方差能更好的反映空间的相关性问题。
3、直接通过空间插值来反映其相关性。空间插值反映相关性时,问题求解虽然比较简单,但是基本不可解决复杂问题。
C、多解问题
进行重构时,由不同的已知信息源,以及不同的参数、权重、背景知识,在同一计算点将可能得到各种各样的解。对这种多解的处理和表达,事实上就是概率理论的本质体现。在传统的插值领域所说的插值函数,其实得到的就是最大概率属性解。从理论上可以这么说,任何一个插值函数,都可以以概率的形式来进行描述。
四、N维重构的常用算法
局部向整体重构问题的常用算法,归纳起来有两大类。第一大类是重构结果满足所有已知边界的重构算法,如有限元中形函数法、各种曲线曲面插值算法、各种样条函数法。第二大类是不完全经过所有已知边界的重构算法,如趋势面分析法、克里金法、各种统计学方法、贝塞尔曲线法等。这类算法主要通过两类因素来控制结果,一类因素是通过期望、方差和协方差等统计学参数来进行条件约束;二类是通过函数的可导性和连续性来进行条件约束。
对于局部向整体重构领域,目前有两大类问题基本是不可求解的。
1、第一类问题是从离散或连续的已知边界向三维及三维以上的体空间进行重构的问题。如三维地质重构问题等,目前算法基本只能解决边界条件非常简单的情况,对于复杂情况基本是不可求解,必须进行大量的人工干预和简化才能得到较好的解。
2、第二类问题是从N维点进行N维曲面、曲线拟合时,考虑半限制性条件的重构问题。
也就是说进行N维曲线、曲面重构时,对重构曲面、曲线的单调性、凹凸性进行了要求。此时应用传统各种重构算法,基本上也是不可求解的。在此所说的半限制条件是相对函数的连续性和可导性来说的,因为连续性和可导性在插值函数中往往能直接反映,但是单调性和凹凸性在插值分析中是很难直接体现的。
对于映射重构问题的常用算法,目前自动化程度都不太高,需要大量的人工干预,基本可以归纳为三大类。
1、第一大类通过新的映射(变换),漏掉噪声,放大主要属性信息,来实现重构。
2、第二类是直接根据已知映射信息的某种变化关系,如统计信息量、梯度等,并结合相应的背景知识来进行重构分析。
3、第三类是综合已知映射信息和某些标准信息来进行耦合分析。其实这些算法往往都是涉及模式识别和图形图像分割领域的算法。
对于混合重构领域,目前还没有可以进行分析的算法,基本需要耦合以上两类方法来加以解决。归纳起来,共有两种解决方案:第一种方案是先将所有的映射信息转化为确定性信息后,再按局部重构方法来进行整体重构;第二种方案是先将所有的映射信息进行整体重构,然后再综合所有的这些信息来进一步进行整体分析。
|