通過 C# 實(shí)現(xiàn)房屋中介行業(yè)數(shù)據(jù)的模糊匹配

作者:宋家麟時(shí)間:2017-05-09 08:59:38  來源:  閱讀次數(shù):2152次 ]
以往房產(chǎn)中介企業(yè)以房源信息為導(dǎo)向,
而對業(yè)績狀況做分析可以幫助決策層更了解自
己和對手。企業(yè)的管理者需要從系統(tǒng)中發(fā)掘更
多數(shù)據(jù)資產(chǎn),基于此來進(jìn)行更好地進(jìn)行市場的
戰(zhàn)略部署。
本文結(jié)合微軟的 .NET 技術(shù),對現(xiàn)有的房
源信息、銷售數(shù)據(jù)和市場成交數(shù)據(jù)依據(jù)規(guī)則進(jìn)
行匹配,幫助案例企業(yè)實(shí)時(shí)地了解企業(yè)的業(yè)績
狀況,提高業(yè)務(wù)決策的有效性和可靠性。
1 案例企業(yè)已有數(shù)據(jù)系統(tǒng)的現(xiàn)狀
案例企業(yè)成立于 1998 年,在其他中介公
司還是基于 Excel 或者使用紙筆來記錄房源信
息和客戶帶看信息的時(shí)候。該公司已定制部署
了一套 C/S 架構(gòu)的集中式房源管理信息系統(tǒng)。
在互聯(lián)網(wǎng)大潮下,企業(yè)已無法依賴單一信
息系統(tǒng)來與新進(jìn)者競爭。管理層迫切地希望可
以通過新的IT技術(shù)手段,把房源等內(nèi)部信息,
與外部數(shù)據(jù)結(jié)合起來做分析,形成一個(gè)數(shù)據(jù)平
臺,消除數(shù)據(jù)孤島。
2 數(shù)據(jù)匹配
數(shù)據(jù)匹配是數(shù)據(jù)之間按照某種內(nèi)在關(guān)系
進(jìn)行配準(zhǔn)。
確定性數(shù)據(jù)匹配方法中,當(dāng)參與匹配的
列都滿足匹配規(guī)則(相等規(guī)約)時(shí),這對記錄
被認(rèn)為是同一個(gè)實(shí)體。目前比較通用的做法是
計(jì)算每對記錄的匹配權(quán)重,與用戶手動設(shè)定的
界限值比較,根據(jù)比較結(jié)果,將該對記錄分類
為匹配,不匹配或可能匹配。
3 C#
通過 C# 實(shí)現(xiàn)房屋中介行業(yè)數(shù)據(jù)的模糊匹配
文/宋家麟
房屋中介行業(yè)的經(jīng)營者常會
從不同的數(shù)據(jù)源中提取相關(guān)的成
交數(shù)據(jù)、業(yè)績數(shù)據(jù),對數(shù)據(jù)進(jìn)行
清理以保證數(shù)據(jù)的正確性。隨后
將數(shù)據(jù)進(jìn)行不同維度的匹配,從
而將數(shù)據(jù)變?yōu)樾畔⒑椭R,以輔
助企業(yè)做出正確的決策。本文嘗
試通過 C# 語言結(jié)合正則表達(dá)式來
解釋數(shù)據(jù)進(jìn)行匹配如何在行業(yè)中
應(yīng)用。


C#是微軟推出的一種基于.NET框架的、
面向?qū)ο蟮母呒壘幊陶Z言。C ♯由 C 語言和
C++ 派生而來,繼承了其強(qiáng)大的性能,同時(shí)又
以 .NET 框架類庫作為基礎(chǔ),擁有類似 Visual
Basic 的快速開發(fā)能力。
C# 并不被編譯成為能夠直接在計(jì)算機(jī)
上執(zhí)行的二進(jìn)制本地代碼。與 Java 類似,它
被編譯成為中間代碼(Microsoft Intermediate
Language),然后通過 .NET Framework 的虛
擬機(jī)——被稱之為通用語言運(yùn)行庫——執(zhí)行。
4 正則表達(dá)式
正則表達(dá)式,又稱正規(guī)表示式、常規(guī)表
示法(英語:Regular Expression,在代碼中常
簡寫為 regex),是計(jì)算機(jī)科學(xué)的一個(gè)概念。
正則表達(dá)式使用單個(gè)字符串來描述、匹配一系
列匹配某個(gè)句法規(guī)則的字符串。在很多文本編
輯器里,正則表達(dá)式通常被用來檢索、替換那
些匹配某個(gè)模式的文本。
許多程序設(shè)計(jì)語言都支持利用正則表達(dá)
式進(jìn)行字符串操作。例如,在 C# 中就內(nèi)建了
一個(gè)功能強(qiáng)大的正則表達(dá)式引擎(Regex)。
5 C#結(jié)合正則表達(dá)式進(jìn)行模糊數(shù)據(jù)匹配
的實(shí)例
5.1 數(shù)據(jù)查詢優(yōu)化模塊設(shè)計(jì)
由于全市的樓盤信息眾多,同時(shí)每月的
成交數(shù)據(jù)量也非常大,當(dāng)需要進(jìn)行多維度數(shù)據(jù)
查詢時(shí),會遇到系統(tǒng)性能瓶頸。故預(yù)先將不同
數(shù)據(jù)源的數(shù)據(jù)依據(jù)一定業(yè)務(wù)規(guī)則進(jìn)行匹配,并
預(yù)處理和分類。
5.2 數(shù)據(jù)查詢優(yōu)化有關(guān)的主要程序代碼
5.2.1 將外部數(shù)據(jù)與內(nèi)部數(shù)據(jù)進(jìn)行整合、匹配
C# 代碼中使用正則表達(dá)式,通過物業(yè)地
址的近似度,將臨時(shí)表中的成交數(shù)據(jù)與盤源系
統(tǒng)中的盤源數(shù)據(jù)進(jìn)行匹配。下面以 *** 路 ***
弄 *** 支弄為例。
(1)在代碼中定義正則表達(dá)式。
static string fullAddressFormat1 = @"(.+)
路 (\d+) 弄 (\d+) 支弄 ";
s t a t i c R e g e x a d d R e g 1 = n e w
Regex(fullAddressFormat1);
(2)依據(jù)正則表達(dá)式對內(nèi)存中的數(shù)據(jù)進(jìn)
行判斷。
if(addReg1.IsMatch(centaPropAddress))
{
……
}
(3)依據(jù)維度信息計(jì)算數(shù)據(jù)的排列、組
合與計(jì)算
EnumerableRowCollection<DataRow>
queryDtAgencyTotal =
from agencyAmount in dtAgency.
AsEnumerable()
where agencyAmount.
Field<String>("EstateName2").Trim().
Equals(row["EstateName2"].ToString().Trim())
select agencyAmount;
(4)合并 HTML 代碼至結(jié)果集的主要代
碼如下:
s b T a b l e . A p p e n d ( " < t d
class=Row1Col2>");
sbTable.Append(dtRegionTotalAmount.
Rows[i]["amount"].ToString().Trim());
sbTable.Append("</td>");
(5)序列化數(shù)據(jù)并入庫
嵌有 HTML 代碼的數(shù)據(jù)流無法直接存入
數(shù)據(jù)庫中,故采用了 .NET 框架中所提供的序
列化函數(shù)來對數(shù)據(jù)內(nèi)容進(jìn)行處理。
sbArea.Append(CentaBI.ReportLogic.
Common.SerializeDataTableXml(dtAreaResult));
6 總結(jié)
為了適應(yīng)行業(yè)變化,本文設(shè)計(jì)并實(shí)現(xiàn)了
一種通過 C# 與正則表達(dá)式相結(jié)合為核心的數(shù)
據(jù)匹配模塊。通過掌握更多的行業(yè)數(shù)據(jù)、企業(yè)
經(jīng)營業(yè)績數(shù)據(jù),成功地為企業(yè)的管理和決策提
供有力依據(jù)。
參考文獻(xiàn)
[1] 熊建芳,高繼,任賀宇,基于 ASP.NET 的
ADO 與 ADO.NET 分析與研究 [J]. 計(jì)算機(jī)與
現(xiàn)代化 ,2006(07),36-38.
[2] 譚學(xué)清 , 譚永麗 , 陸泉 , 陳靜 . 商務(wù)智能
[M]. 武漢 : 武漢大學(xué)出版社 ,2006(10).
[ 3 ] A l i s t a i r M c L e o d , B u s i n e s s
Intelligence:Discover the truth
about your business,Waterstons white
paper,2005,3-5.
作者單位
上海大學(xué)計(jì)算機(jī)工程與科學(xué)學(xué)院 上海市
200444

本站論文資源均為來自網(wǎng)絡(luò)轉(zhuǎn)載,免費(fèi)提供給廣大作者參考,不進(jìn)行任何贏利,如有版權(quán)問題,請聯(lián)系管理員刪除! 快速論文發(fā)表網(wǎng)(www.6scc.cn)本中心和國內(nèi)數(shù)百家期刊雜志社有良好的合作關(guān)系,可以幫客戶代發(fā)論文投稿.

投稿郵箱:ksfbw@126.com
客服Q  Q: 論文發(fā)表在線咨詢82702382
聯(lián)系電話:15295038833

本站論文資源均為來自網(wǎng)絡(luò)轉(zhuǎn)載,免費(fèi)提供給廣大作者參考,不進(jìn)行任何贏利,如有版權(quán)問題,請聯(lián)系管理員刪除!

廣告推薦

文章評論

共有 0 位網(wǎng)友發(fā)表了評論

閱讀排行

推薦文章

最新文章

主站蜘蛛池模板: 欧美亚洲日本国产综合网| 国产精品国产欧美综合一区| 国产欧美视频综合二区| av色综合久久天堂av色综合在| 91精品欧美综合在线观看| 久久亚洲欧洲国产综合| 狠狠色婷婷久久综合频道日韩| 一本色道久久综合| 国产综合亚洲专区在线| 无码专区久久综合久中文字幕| 色综合久久综合中文综合网| 99久久国产综合精品五月天喷水 | 亚洲色偷偷偷鲁综合| 亚洲乱码中文字幕综合| 亚洲综合色视频在线观看| 亚洲欧美日韩国产综合在线| 色综合婷婷在线观看66| 久久本道久久综合伊人| 久久婷婷五月综合97色直播 | 色天使久久综合网天天| 亚洲精品第一综合99久久| 国产成+人+综合+欧美亚洲| 欧美久久综合九色综合| 久久93精品国产91久久综合| 无码专区久久综合久中文字幕| 国产成人亚洲综合无码| 国产成人99久久亚洲综合精品| 久久久久亚洲AV综合波多野结衣| 亚洲国产欧美国产综合久久| 婷婷丁香五月激情综合| 国产精品亚洲综合久久| 亚洲综合av永久无码精品一区二区| 国产成人精品久久综合| 欧美色综合久久久久久| 国产香蕉久久精品综合网| 一本久久知道综合久久| 欧美一区二区三区久久综合| 2021精品国产综合久久| 激情综合色五月丁香六月欧美 | 狠狠色狠狠色综合日日不卡| 伊人久久综合无码成人网|