Categories
Technology

中国的测绘事业从未如此兴盛

地图,满山遍野的地图,平面的、三维的、卫星的,现在百度也有了。

view了一把source,百度用了一个iframe,把一个页面(http://baidu.mapbar.com/baidu/)嵌进了它的地图首页(http://map.baidu.com/)”。与Google中国地图一样,百度同样是与国内地图厂商合作,百度是Mapbar,Google是Mapabc,捧着go2map金饭碗的搜狐好像还饿着肚子。

这个被嵌入的页面有点意思,首先是右边的404错误(用的是Tomcat),另外有一个“卫星地图”链接,似乎无效。

长期以来被政府掌控的中国GIS信息被其拥有者,国有单位下属的企业迅速商业化,2004年只有两家,今年超过8家。既为民造福,又能挣钱,何乐不为。

Categories
Technology

Google Wifi Secure Connection

Google Wifi Secure Connection? 论坛上说可以用作一个VPN代理服务器跨过国内边界防火墙,下载安装后用新雨丝测试,失败。想想咱们的金盾能让Google溜掉,不太可能~

if (GVPN == true) {

    GVPNinChina.isBlocked = true.;

    KaifuLee.setTrouble(true);

} else {

    JAGR = true;

}

JAGR = Just Another Google Rumor

Categories
Technology

DIY外置DVD刻录机

半年前就想买一个外置式的DVD刻录机,无奈一般的外置式都在1800元上下便一直没出手。今天在网上搜“光驱盒”,发现自己现在用的“Newman”外置硬盘盒还有类似外置光驱盒产品。在新蛋上,Newman刻录通(支持USB 2.0,加内置风扇)卖200块,加上一个普通内置式DVD刻录机,700块可以搞定。

5分钟的检索节省了1000多块的开支。

Categories
Technology

Internet Based Research

我花在用网络解决生活和工作上的问题的时间越来越多。比如前段时间装修,每个晚上都泡在网上研究油漆的种类和地板的脚感。如今买任何一样超过500块的东西,一定要到网上相关站点和论坛泡个几天、几周的时间调研,然后决策。从实际效果上看,基本避免了头脑发热和信息不对称导致的受骗上当,采购决策比较成功。

除了个人生活外,利用Web还可以自助化的完成对陌生领域的资料收集、研究,使得在短时间内迅速成为一个领域的准专家。所需的就是一台电脑,一根网线。高质量搜索引擎的诞生,漂亮的完成了信息共产。信息就这样赤裸裸的、免费的摆在每个人的面前,有效的组织和发掘意味着知识和财富。

用”Internet Based Research”在Google查询(完全匹配),有7万多条记录,而Google Scholar翻出了相关的研究论文,包括如何在互联网上做survey;在Google Adsense的广告中,则是一个市场调研报告提供商的广告。还有一些tutorial样式的文章,如:

Becoming a Better Web Researcher: http://kerlins.net/scott/november.html

How to Conduct Research on the Internet: http://www.tbchad.com/resrch.html

我个人的经验是:如果研究有关国内相关行业、产品等信息,一定要访问三类网站:

1. 搜索引擎。这个就不用谈了,everybody talks about Google, Baidu;

2. 行业组织网站,企业网站。有关行业、产品的权威信息,虽然内容不够翔实且缺客观评价,但不失为一个好的reference;

3. 论坛。我们的BBS啊,坛子啊,帖子啊,人品啊。。。在中国,论坛为王。不官是周公子、小P孩,还是黑蓝白灰领,大家都需要到坛子里败败火,这是一个unplug的宝地。

Categories
Technology

尝鲜JBuilder 2006,未尽兴

从Borland的FTP上下了JBuilder 2006企业测试版,原以为是基于Eclipse的全新版本,可安装好后才发现还是老架构,没变。在水木新软版上找到了答案:JBuilder 2006是双branch开发,一个是老架构,另一个是based on Eclipse。

JBuilder粉丝可以刻盘了,因为这将是经典JBuilder系列最后一个版本了。

Categories
Technology

百度-更懂中文?

睡觉前看到一个帖子,是一个百度的视频广告,请了唐伯虎代言自己的中文处理能力。本想亲自验证一下,发现已有好事者为之

中文分词,国内研究机构做的比较好我知道的有上海交大的纳迅。IBM也有自己的中文分词技术,位于爱尔兰的实验室开发出了LanguageWare,一个专门进行自然语言处理的工具集。

用”google chinese segmentation”搜索,可以看到2002年的一份报道,讲到了Google使用了第三方的中文分词技术。

回复

– 评论人:fengdingcn
  2005-09-16 17:11:05   

有传言说百度用的是海量科技的中文分词技术。

海量科技公司 http://www.hylanda.com

http://www.digdig.com.cn/

http://home.donews.com/donews/article/5/56087.html

Categories
Technology

贝尔实验室关闭1127部门

9月份的SD Times报道:

“Lucent Technology has offically closed down department 1127, the research group responsible for the creation of Unix in 1969”.

一份稍微详细的报道:Dept. 1127: going, Going, GONE!

Categories
Technology

GAIM做了不该做的事

GAIM已经用了几个礼拜了,MSN和GTalk都工作的很好。其中有两个功能让我觉得不太舒服,我宁愿不去知道这些被MSN Messanger隐藏的信息。

1. GAIM可以显示你的MSN列表中的人是否也把你加入到他们的列表中。有时候我会加一个人,然后再删掉。如果对方用GAIM上线的话可以知道你已经把他从列表中删除了;

2. 关于隐私。在聊天过程中,当对方关闭聊天窗口后,GAIM立刻在自己一方的窗口中显示出该事件:XXX has closed the conversation window。如果我不想回消息,很快关闭了窗口,对方就知道我是存心不回,假装不在。“关闭聊天窗口”这个动作隐含的东西很多:他/她很忙吗;他/她想和我聊天吗;他/她是不是在躲避…我感觉自己随时在窥探别人的隐私。

Categories
Technology

3D上海地图

无意中发现了一个3D地图网站:http://www.edushi.com/,现有杭州、上海和温州的3D地图供查询。看了一下上海的3D地图,必须承认,相当的impressive。阿土仔(伯)终于活了~~

我浏览了几个区域,如徐家汇、淮海路/黄陂路和陆家嘴一带的地貌,图中建筑与实际95%以上一致,而且数据很新。比如可以看到襄阳北路口刚刚建好的“嘉华中心”。

下面是我截取的交大徐汇校区和淮海路、陕西南路的两处地貌,小加分析:

1. 上海交大徐汇校区

无论是浩然大厦、图书馆、新建楼和中院3D图示神似。图中的两处错误分别是(1)包兆龙图书馆需顺时针转90度;(2)老图书馆需逆时针转90度。

2. 淮海中路、陕西南路

上图中的(1)为百盛;(2)为二百永新;(3)为国泰电影院。值得注意的是蜚声中外的襄阳路市场在图中被标成“菜场”。我注上“假”字为其本质正名。

Anyway,这个3D地图很招人喜欢,希望能不断完善。下面是几个建议:

1. 请支持Firefox;

2. 希望可以支持鼠标拖拽地图(类似Google Maps),使用上下左右控制条不方便;

3. 能否提供多视角。现在的视角为自南向北俯冲45度,如果可以提供可切换的多视角(最好能360度旋转),就太cool了;

4. 需要支持zoom in/out。

回复

– 评论人:boo
  2006-06-03 21:48:57   

我已经半年多没看过这个网站了。。。。

– 评论人:cui
  2006-06-03 15:16:52   

很多大的百货或超市找不到的 还少的可怜地图里

– 评论人:王弈菱
  2005-10-03 14:51:04   

象是小孩玩的玩具堆砌成的….

– 评论人:boo
  2005-09-16 00:25:22   

原来是这样,我孤陋寡闻了。

– 评论人:cat
  2005-09-15 17:25:24   

不过襄阳路后面确实是个菜市场,按照他的箭头所指的方向,大致没错。。呵呵

– 评论人:lixian
  2005-09-14 14:34:40   

东西是很好,不过操作起来太不方便了,好多次我按右一点反映都没有,按左却往右移动,只好放弃。

Categories
Technology

GAIM与cygwin冲突解决方法

上周五为了在Eclipse CDT下编译调试C/C++程序,安装了Cygwin。随后发现GAIM无法正常工作,启动后GAIM进程保留但界面消失。

讨论组证实了该问题,给出的解决方法是在system path中去掉cygwin/bin,虽然可以解决GAIM的问题, 但由于路径丢失Eclipse中无法调用g++。综合多方线索,找到的最佳解决方案为:保留系统路径中cygwin/bin目录,将cygwin/bin目录下的tcl84.dll和tclpip84.dll改名禁用即可。

以上解决方案在GAIM 1.5, Cygwin 2.51下验证通过。

Categories
Technology

Lost in Translation

星期六晚上去了浦东联洋社区的Papa John’s吃匹萨。自大拇指广场开张后,是第一次来参观。几个篮球场大小的范围内聚集了KFC、MAC、PizzaHut、Papa John’s、味千、避风塘、许留山、Starbuck等餐饮店。这里老外人数不少,拖家带口的,我隔壁的一桌是老说中、少说英;人走撤掉后新来的一对又开始说日本话。在这里当服务员不容易。

传说中的Papa John’s的双味pizza感觉也就一般,可能期望值比较高,价格方面和PizzaHut基本相当。倒是结帐时的收据引起了我的注意:在收银条的最下方写着“变化:10.0 RMB”。一共110块的餐费付了120块,这10块显然是找零,也就是change了。据此可以猜想Papa John’s的POS系统的本地化是这么完成的:

1. 把英文版系统中所有硬编码的英文字符串抽取出来,放到一个文本文件中;

2. 把该文本文件交给翻译提供商进行中文翻译;

3. 把翻译好的字符串重新放回到程序中。

可惜在翻译的时候,由于缺少了上下文环境,单看一个“change”,谁来翻都得翻成“变化”。对于用餐的人来说,自然“迷失在翻译中”了。以前还曾经在一本IBM白皮书中文版里面看到过“登台服务器”这个名词,觉得非常纳闷,参照原文一看,原来是“staging server”,跑的太远了。

不知道技术翻译行业里面有没有context awareness translation一说,让翻译者看到被翻译文字所处的上下文不应该是optional,而是must。

Categories
Technology

一个图章软件

在网上逛,发现了这个“数据制卡排版精灵”,终于明白了论坛里各种“专用章”是怎么造出来的。下面是用试用版做的一个图章:

图章

Categories
Technology

bendi

Google本地搜索的中文版域名居然是:http://bendi.google.com。好一个“bendi”,本土化彻底的很呀。如果想访问印度的本地服务,前缀该用什么呢?印度语还是古吉拉特语的字母拼音??

http://local.google.com/zh不比“bendi”好吗?要换成其他国家的本地服务只要换换国家码就好了(/in, /jp, /uk)。

本地化应该有个尺度,看得懂这个吗:一台配备有英特尔中央处理器和迅弛技术,由国际商业机器有限公司制造的“思考本”可以运行微软公司的视窗“体验”操作系统。

回复

– 评论人:boo
  2005-09-06 21:58:17   

Google东西确实不错,同行的感觉应该是咄咄逼人、刀刀见红了。

– 评论人:lixian
  2005-09-06 19:52:35   

不错的东西,我最近查电信的地址什么的都是用的它。其实如果衍生出来还可以提供很多服务,比如GIS或者GPS的类似服务,都是很有前景的,凭着google目前的铁血前行政策。

Categories
Technology

今天你烧了没有?

我烧过:

1. CDR

2. MD

3. GBA游戏卡

4. 主板BIOS、显卡固件

5. MP3固件

6. 无线网卡固件

7. 无线路由器固件

尚未烧过,但很想烧的:

1. DVD(+-*/)ROM

2. 手机、PDA操作系统

4. 卫星电视接受卡

与时俱进,必须烧。

Categories
Technology

懒得更新

Winzip真是懒的可以,一年出一个新build算很对的起用户了。9月1日开学第一天放出10.0 Beta后,不知明年这个时候后面这个“Beta”会不会去掉。这周LeapFTP也放了一个patch版,离上一次更新差不多有一年了。

是该考虑踢掉这些老怪物的时候了,这些不思进取的商业软件迟早要败在7 ZipFilezilla手里,永无翻身之日。

Categories
Technology

不停疯狂找寻你

新浪论坛在超级女声的信息大战中结结实实的败给了百度贴吧。新浪成功的时事热评模式被证明为不能满足那些疯狂找寻信息的网民。好在新浪UC由于张靓颖和凉粉的参与人气急升,在信息大战中挽回了一点败局。

8月26日晚的总决赛我是这么看完的:电视拨到湖南卫视;Cterm到水木“超级女声”版和“靓声靓影”版;浏览器指向百度“超级女声吧”和“张靓颖吧”。一曲完毕或者广告时间便立即浏览BBS和贴吧上的新贴热评,看看水木“贺电”;看看那个“湖南卫视舞美师”有没有新的爆料。

P2P stream在这次饕餮大餐中也锋芒毕露,高校里没有有线电视的学生和海外观众都挤在网上看直播。

几点结论:

1. 动态的主题式信息群落在发生信息垄断(湖南卫视)的时候发挥的作用巨大;

2. 多媒体信息的实时发布和共享越来越重要;

3. 当对信息极度渴望的时候,甚至期待谎言的出现。

Categories
Technology

平平淡淡的Google Talk

前天在第一时间下载安装了Google Talk,Google Talk从功能和界面都没有太出彩的地方。字体、表情、传文件、多方等均不支持。我还没试过它的语音功能,从最终用户的角度想一下应该和MSN/QQ,甚至Skype没太多区别。Google Talk界面上与GMail的链接也有点鸡肋的味道,意义不大。Google Talk让我想到了IBM的Sametime。Sametime由服务器和客户端组成,Sametime client的功能同样不支持表情、字体、传文件,但支持多方。在语音方面,IBM会和Avaya合作在后续版本中支持

GMail一年前出来的时候,我很快便把Yahoo邮件上订阅的服务和各种帐单的邮件地址迁移过来。Google Talk呢,我在考虑是否要卸载它,因为我现在使用的GAIM已经很好的集成了MSN和Google Talk的XMPP服务。

当Google持续膨胀的时候,必然会染上大公司习气,诸多问题如产品的定位、技术资源管理问题如何在短裤和拖鞋的文化中有效的解决,人力、组织结构、市场管理与技术至上如何平衡,有待Google思考。这里就有一个小细节可以暴露出小小的不和谐:Google Earth的用户数据文件保存在“C:\Documents and Settings\zhangl\Application Data\Google\GoogleEarth”中的;而Google Talk的用户文件(聊天记录等)却保存在“C:\Documents and Settings\zhangl\Local Settings\Application Data\Google\Google Talk”目录中。上帝存在于细节当中,Google是极重视细节的公司,随着产品越来越多,彼此之间的不统一会慢慢显现出来。从技术管理的角度上要考虑的问题包括:应用程序是否需要统一的Installer?界面设计是否有统一标准?文件格式和存取的统一性?各个产品之间是否能共享组件?…解决这些问题需要coordinate、需要开会、需要制订guideline、需要review…Google总有一天都是要经历的。

回复

– 评论人:boo
  2005-08-26 17:34:53   boo的博客  

Google IM的计划已经有一段时间了,筹钱可能会收购一些公司。

– 评论人:QQ
  2005-08-26 09:40:43   

Google现在的不断的动作是不是和前阵增行1400万股,募集39.2亿美元有关呢

Categories
Technology

终于有了带language pack的病毒了

在遇到需要手工查毒的时候,一般要去Windows管理工具的Services里面看看有没有异常进程。一个简单的区正常服务进程和病毒的技巧是看该服务在列表中“描述”这一项是否为空,或者是不是英文的。绝大多输病毒制造者没有细致到在这些地方做手脚。这对于中文用户来说却是个好处:那些没有或者是有英文描述的进程往往是重点怀疑对象。

而今天终于出来一个认识到全球化重要意义的病毒作者,这个MSN病毒会检测用户的语言版本,根据产品语言版本不同发送不同语言的假MSN消息,更有效的麻痹用户。更高级的本地化的病毒除了带上语言包外,还可以根据本地RSS新闻或者Google Zeitgeist查询排名制造智能假消息诱骗用户。Globalization Customization这篇文章可以作为理论基础吧。

Categories
Technology

Sell your buddies

QQ是我最早用过的IM工具-那是99年的夏天。现在的6位数ID也是那时申请的。2000年下半年到2002年低是用的最凶的时候,天天在实验室挂在上面。那个时候的QQ还是个轻量级的软件,就是发送即时讯息,什么短信、游戏都没有。而现在的QQ,就像是一只帝企鹅,又肥又大,行动不便,急需减肥。

QQ从最早的版本到现在一直有一个MSN没有的功能:搜索在线网友。QQ会员还拥有高级的查询选项,如按照性别、城市等。这样就可以查到一长串的包含稀奇古怪昵称的列表,比如什么“大力水手”,“野原新之助”,“善解人衣”等等等等。。。QQ的昵称是可以编辑的,这个MSN也可以,不过我很少看到自己QQ好友列表上的人频繁的修改自己的昵称。

在看看MSN。编辑昵称已经成为很多MSN用户最热衷做的事情:一周一个、一天一个、一天几个;不少人的昵称可以很有效的折射出该在线用户当时的生活状态。这就是下面我要讲的“歪路”,是有关出卖在线好友的。

虽然昵称可以编辑,但MSN从来不允许你主动查询:你只能通过对方给你的Email地址来添加用户。与QQ相比,后者也许更适合小P孩来发现新关系;而MSN则是用来维系老的关系。在一个具有千万级用户的IM系统里面,用户在频繁的更新他们的自我称呼,如果可以跟踪所有这些使用过的昵称,在把当时的相关信息整合进来,是不是可以挖掘出很多潜在的信息呢?

我猜想MSN服务器是不会维护每个用户曾经使用过的昵称的,用户自己也不会。老的签名在敲回车的一瞬间永远的消失了。如果这个信息可以保留,如果这个信息可以检索,那么是不是可以画出一根时间轴:轴上是根据时间点标记出用户在该时间点使用的昵称;轴下在时间点周围是整个世界上、一个国家、一个地区发生过的事情;它还可以链接到你的Email系统,给出时间点前后几日的Email摘要,你的blog,写过的IM等等(受控信息)。如果所有MSN的用户信息(除了轴下方与个人有关的信息外)都可以供所有人检索并根据这些信息来添加用户的话,MSN会变成什么样?

现在的MSN Messenager自然是不支持的,也许可以开发出一个插件安装在MSN上,当在线用户更改昵称后更新好友列表到某个server上。该Server提供一个Web界面供检索之用。比如可以输入“牌照拍卖”,也许可以找到几十上百个来自上海、正琢磨车牌拍卖事情的用户;在沿着“轴”回溯也许可以发现他们中的一些在1年前的昵称是“装修中…”。

99%的可能是这个网站很快就和李开复一样,收到来自雷德蒙的律师信;也许有了这个功能后一堆人都会放弃MSN去寻找其他安全、封闭的聊天软件。Who knows…

回复

– 评论人:boo
  2005-08-30 13:16:26   

Web crawler在检索的时候会查看根目录下的robots.txt文件,决定是否进行索引。不过虽然这是RFC的规范,但不能保证每个robot都这样做。

– 评论人:Peter
  2005-08-29 22:45:21   

我还想到了一个MSN没做到,但是可以做到的功能。就是msn应该让用户选择是否把自己在其它msn space 上的留言或该留言附着的blog以某种方式保存在用户自己的信息库中。我觉得这样的话,msn space就更人性化了。其它blog也应该提供这样的功能。不知道已经有了这种功能没有?

– 评论人:Peter
  2005-08-29 22:29:14   

Hi,Dr .Zhang:)

我是Peter,今天才看到你的blog,很有意思。觉得你的blog是我的一个向你学习交流的好平台:)

你的这篇文章所思考的问题,我也有过同样的想法(当然了,没有你的周全),我当时也认为这些个性签名能提供很有意思的信息。像msn,要保存这些签名其实也很简单,只需要用户更新签名的时候,把签名当作msn space 的blog或其它list的一个new entry 不就可以以blog的形式保存了吗?我当时就在像为什么msn不提供这么简单的功能?我也想过自己手工地保留每天我msn好友列表上的镜像,以跟踪每个好友的签名变化情况,从而更方便地了解各个好友,但是我并没有坚持下来,我能做到的就是心里面记住了某些朋友的某些日子的签名。当然了,稍微用心想想,也会想到这会涉及到隐私问题。我也想过,随着网络引擎的日益强大和网民们自我保护意识的加强,会不会出现这种情况?就是以后我们发布blog或其它信息的时候,都会选择一个访问控制的catalog,定义该信息的访问权限,private or public 等等,而各大搜索引擎(爬虫)也遵循这样一个规则,只对用户定义为public的信息进行搜集和提供检索。这样一来,就两全其美了。

Categories
Technology

Firefox书签导入IE之乱码处理

我的绝大多数的书签都已经转移到Firefox里,IE的书签至少半年没有更新过了。刚才想把两个浏览器的书签单向同步一下,发现从Firefox导出的书签文件再导入到IE里,中文部分出现乱码。稍加研究,顺利解决。

1. 从Firefox导出的书签是一个HTML文件,该文件的编码是UTF-8。可以判定,从中文版IE导入此文件后,IE用GB2312进行解码,导致乱码。

2. 用Ultraedit打开bookmarks.html,copy然后paste到notepad里面,保存(编码选ANSI),会有警告,忽略即可。

3. 从IE导入修改后的书签文件,一切OK.

回复

– 评论人:boo
  2005-10-09 20:45:38   

从Ultraedit里全部copy到notepad中,按ANSI格式保存为一个HTML文件。用IE把该HTML文件导入即可。这个方法对我有效。

– 评论人:Garry
  2005-10-07 17:51:36   

根本就不行,导入之后都是乱码,期待解决方案!