这一年被阿里云坑过的点点

从大学就开始玩VPS了,从最开始的linode到如今的阿里云。创业以前一直是玩linode,在日本的机器,ping起来速度还挺快,也方便自己建立代理使用google查询一些技术资料。后来创业了,因为是在国内创业,就只能走『正途』了,国外的Amazon之类也就不在考虑范围内了,便使用起了阿里云,老老实实走各种备案流程。Amazon占据全球一半的云机份额,但也无法入华,阿里云在国内的非技术红利,让你别无选择,一如当年的百度与谷歌之争。

创业一年,自己既是开发也是运维,手里一直维护着五、六台阿里云机,产品用户量高时达到过百万级别,日活高时也达到了四万左右。回想一年来被这些云机折腾得心力交瘁,也是醉了。偶尔发放的一些优惠券是唯一安慰,所以有人说:阿里云特别了解屌丝公司的心理。细数一下这一年被阿里云折腾的点点。

阿里云被吐槽最多的就是IO慢了,这个相信是『闻名遐迩』了。当年还在熊厂时,因为是做搜索核心严务的,公司也大方,所以手里有十几台测试机,都是24核心64GB内存的真机,但是负责的模块一启动就占用内存56GB,所以还总是忿忿,觉得机器配置太低了,当时硬盘IO能达到100M/s,觉得配置上SSD能提高多少做事效率啊。后来创业了,想想阿里云因为是云机,所有IO都是走的网络,应该会慢不少,结果实测才发现慢得让人一惊,连续写才十几M/s,如果是随机写也就7M/s,可恰恰我们创业搞的是社交APP,随机写非常多,一到晚高峰就卡得不行,所以没办法,只能拿内存当磁盘使了,我们采用4核16GB的机器配置,这样弄也只是一时爽,当重启Mysql等服务时,内存的数据总归还是要落到磁盘上的,结果半天服务停不掉,又不敢kill -9强杀,怕数据丢失损坏了,然后就一直等到深更半夜。为这事熬过不少夜,也想过不少解决办法,比如将Mysql从5.5升级到最新版本,因为据说新版本对IO有优化改进;减少随机写,比如用户端每次请求都会上报经纬度,也要更新用户的在线时间,这些能少更新就少更新;压缩数据,能减小磁盘占用就尽量减小。如果这样也还能扛得过去,但问题是这IO还不稳定,有一次折腾到半夜三点,发现IO慢到了极点,几乎到了写都写不了的地步,没办法发工单请求技术支持,从半夜三点等到半夜四点,等到了回复,说这台机器有问题,要帮我们换一台机器,结果是大半夜换机器,我当时就无语了。除了这点无语外还有两点很不爽,其一,这工单什么时候回复是没准的,我问可不可以直接打电话沟通,对方说不行,然后线上服务没有恢复,自己又不能说直接去睡觉,其二,对方很有道理地在工单里推销道----『你们买的是我们的普通机器,想要更好的IO优化过的机器,请购买XXX』。没办法,后来我们就『老老实实』地购买了IO优化过的机器,可以挂载SSD,用起来确实是爽了,但是费用也多了不少。

8月份左右的时候,阿里云又出了一事:所有你执行的系统命令会被阿里监控程序所删除掉。这事闹得挺大,一时间微信、微博各同行都在抱怨这事。当天我遇到这事是比较早的,也没有先兆,我在一台机器上执行了apt-get相关命令,结果apt-get就报不存在,我当时一惊,试了几个其他命令,一下了ps、top、memcache都没了,我在其他机器也试了一把,发现同样的情况也出现了,这时我就估计到应该不是我的问题,而是阿里云的问题。于是提交工单,等待回复,后来通过微信才知道『出大事了』。后来阿里云为平息事态,提出100倍赔付,作为屌丝公司一员心里还一喜,结果是按出事故的10小时乘以100,也就是给免费续费了1000小时而已。白高兴了,我们的项目进度,精力消耗,用户体验,难道只是区区几百块钱的损失么?!

今年飞机失联,证券大佬失联,我们的几台机器也会失联。据说各大互联网公司每年退役的机器不怎么处理,于是都开始做云服务了,所以运气好能随机到好机器,运气不好就悲剧了,机房里的各种设备都是这样,全看运气。

后来创业进入欣欣向荣,一切大好的时期,突然收到阿里云的邮件说我们涉黄,紧接着服务器就被『锁定』了。做社区没有关系背景确实做不了,想想当年的饭否和如今的微博吧,其实我们也早考虑到了这些,我们招了三个全职审核人员,任何用户发的文字和照片都是先由审核人员看一遍然后审核通过才真实发出去的,我们还花了大量精力培训审核人员,告诉他们凡是涉及政治、黄色、毒品的内容全部予以删除,如果用户累犯三次予以封号,我们还开发了复杂的自动审核系统以减轻审核人员的工作压力。所以当接到阿里的关停服务器通知时,还是惊讶不已,多的在此不表,总之在中国创业在干实事之外你得投入大量精力,自行脑补吧。当然这可能跟阿里云无关,但问题是『机器锁定』让人费解,这批机器我们刚续完费,锁定之后,既不能关也不能开,不能登录,也不能访问,还不能释放,更不能退费了,总之就是明摆着钱打了水漂。这也告诫我们,以后续费,不要看着续10个月送两个月就屁颠屁颠地把钱打过去了。

再后来创业进入低谷期,一方面在犹豫做哪个新的方向,另一方面领头的两个boss之间也有些不和。于是因想法不同,后来就决定各干各的了,这个时候跟阿里云相关的一堆麻烦问题就来了。因为阿里云绑定了个人的身份证号,绑定了公司营业执照,这个时候就涉及到要将当前阿里云帐号的机器全部转换到另一个帐号里去,答复是不支持帐号间转让机器,那就只能重新搭建环境了,后来又被告知不同帐号间机器里的数据也不能互通,RDS也不能互通,除非通过外网流量进行拷贝,花钱吧开宽带吧。再后来注册了新公司之后,又被告知帐号绑定的公司不能变更,要么就不要发票不要合同忍了,要么就重新注册帐号,重新购买机器。

阿里云时不时来个调查问卷,时不时来个电话回访,偶尔还建议给写个心得体会,用些蝇头小利勾引屌丝公司。架式很正面,但是问题面前却很难给人以实实在在的便利。以上也正是这一年来使用阿里云的心得体会,希望阿里云能好好改进服务。不过,反观国内的云服务也没几个靠谱的,选择国外的服务又有政策风险,我想,未来有机会还是会尝试一些其他小公司提供的云服务,一直有关注其他,在此也不做推介与对比,有广告之嫌。

发表于 2015年12月08日 16:15   评论:0   阅读:528  



回到顶部

首页 | 关于我 | 关于本站 | 站内留言 | rss
python logo   django logo   tornado logo